GNU/Linux >> Linux の 問題 >  >> Linux

Linux で FLOPS を見積もりますか?

解決策 1:

どうやら「sysbench」ベンチマーク パッケージとコマンドがあるようです:

sudo apt-get install sysbench (または brew install sysbench OS X)

次のように実行します:

sysbench --test=cpu --cpu-max-prime=20000 --num-threads=2 run

比較のための出力:

 total time:                          15.3047s

参照:http://www.midwesternmac.com/blogs/jeff-geerling/2013-vps-benchmarks-linode

解決策 2:

問題は、フロップとはどういう意味ですか?クロックあたりの最も単純な浮動小数点演算の数だけを気にする場合、それはおそらくクロック速度の 3 倍ですが、それはボゴミと同じくらい無意味です。一部の浮動小数点演算には長い時間がかかり (除算、初心者向け)、通常、加算と乗算は高速です (クロックごとに fp 単位ごとに 1 つ)。次の問題はメモリ パフォーマンスです。最後の古典的な CRAY が 31 のメモリ バンクを持っていたのには理由があります。最終的に CPU パフォーマンスは、メモリへの読み書きの速度によって制限されます。では、問題はどのレベルのキャッシュに適合するのでしょうか? Linpack はかつては実際のベンチマークでしたが、現在はキャッシュ (L1 でなくても L2) に収まり、より純粋な理論上の CPU ベンチマークになっています。そしてもちろん、SSE (など) ユニットも浮動小数点のパフォーマンスを追加できます。

どのディストリビューションを実行していますか?

これは良い指針のように見えました:http://linuxtoolkit.blogspot.com/2009/04/intel-optimized-linpack-benchmark-for.html

http://onemansjourneyintolinux.blogspot.com/2008/12/show-us-yer-flops.html

http://www.phoronix-test-suite.com/ はフロップ ベンチマークをインストールする簡単な方法かもしれません。

それでも、なぜ気にするのか、何のために使用しているのか疑問に思います。無意味な数値が必要な場合でも、システムの bogomips は dmesg にあります。

解決策 3:

大まかな見積もりの​​場合:

  • Raspberry Pi 2:299.93 * 10^6 FLOPS (ソース)

  • Raspberry Pi 3:462.07 * 10^6 FLOPS (ソース)

  • GTX Titan Black GPU:5.1 * 10^12 FLOPS (ソース)
  • Sunway TaihuLight:93 * 10^15 FLOPS (出典、2016 年の記録保持者)

リンパック

<オール>
  • ダウンロード (リンク)
  • 抽出
  • cd benchmarks_2017/linux/mkl/benchmarks/linpack
  • ./runme_xeon64
  • しばらくお待ちください (1 時間以上)
  • Thinkpad T460p (Intel i7-6700HQ CPU) では、次のようになります:

    This is a SAMPLE run script for SMP LINPACK. Change it to reflect
    the correct number of CPUs/threads, problem input files, etc..
    ./runme_xeon64: 33: [: -gt: unexpected operator
    Mi 21. Dez 11:50:29 CET 2016
    Intel(R) Optimized LINPACK Benchmark data
    
    Current date/time: Wed Dec 21 11:50:29 2016
    
    CPU frequency:    3.491 GHz
    Number of CPUs: 1
    Number of cores: 4
    Number of threads: 4
    
    Parameters are set to:
    
    Number of tests: 15
    Number of equations to solve (problem size) : 1000  2000  5000  10000 15000 18000 20000 22000 25000 26000 27000 30000 35000 40000 45000
    Leading dimension of array                  : 1000  2000  5008  10000 15000 18008 20016 22008 25000 26000 27000 30000 35000 40000 45000
    Number of trials to run                     : 4     2     2     2     2     2     2     2     2     2     1     1     1     1     1    
    Data alignment value (in Kbytes)            : 4     4     4     4     4     4     4     4     4     4     4     1     1     1     1    
    
    Maximum memory requested that can be used=9800701024, at the size=35000
    
    =================== Timing linear equation system solver ===================
    
    Size   LDA    Align. Time(s)    GFlops   Residual     Residual(norm) Check
    1000   1000   4      0.014      46.5838  1.165068e-12 3.973181e-02   pass
    1000   1000   4      0.010      64.7319  1.165068e-12 3.973181e-02   pass
    1000   1000   4      0.009      77.3583  1.165068e-12 3.973181e-02   pass
    1000   1000   4      0.010      67.0096  1.165068e-12 3.973181e-02   pass
    2000   2000   4      0.064      83.6177  5.001027e-12 4.350281e-02   pass
    2000   2000   4      0.063      84.5568  5.001027e-12 4.350281e-02   pass
    5000   5008   4      0.709      117.6800 2.474679e-11 3.450740e-02   pass
    5000   5008   4      0.699      119.2350 2.474679e-11 3.450740e-02   pass
    10000  10000  4      4.895      136.2439 9.069137e-11 3.197870e-02   pass
    10000  10000  4      4.904      135.9888 9.069137e-11 3.197870e-02   pass
    15000  15000  4      17.260     130.3870 2.052533e-10 3.232773e-02   pass
    15000  15000  4      18.159     123.9303 2.052533e-10 3.232773e-02   pass
    18000  18008  4      31.091     125.0738 2.611497e-10 2.859910e-02   pass
    18000  18008  4      31.869     122.0215 2.611497e-10 2.859910e-02   pass
    20000  20016  4      44.877     118.8622 3.442628e-10 3.047480e-02   pass
    20000  20016  4      44.646     119.4762 3.442628e-10 3.047480e-02   pass
    22000  22008  4      57.918     122.5811 4.714135e-10 3.452918e-02   pass
    22000  22008  4      57.171     124.1816 4.714135e-10 3.452918e-02   pass
    25000  25000  4      86.259     120.7747 5.797896e-10 3.297056e-02   pass
    25000  25000  4      83.721     124.4356 5.797896e-10 3.297056e-02   pass
    26000  26000  4      97.420     120.2906 5.615238e-10 2.952660e-02   pass
    26000  26000  4      96.061     121.9924 5.615238e-10 2.952660e-02   pass
    27000  27000  4      109.479    119.8722 5.956148e-10 2.904520e-02   pass
    30000  30000  1      315.697    57.0225  8.015488e-10 3.159714e-02   pass
    35000  35000  1      2421.281   11.8061  1.161127e-09 3.370575e-02   pass
    
    Performance Summary (GFlops)
    
    Size   LDA    Align.  Average  Maximal
    1000   1000   4       63.9209  77.3583 
    2000   2000   4       84.0872  84.5568 
    5000   5008   4       118.4575 119.2350
    10000  10000  4       136.1164 136.2439
    15000  15000  4       127.1586 130.3870
    18000  18008  4       123.5477 125.0738
    20000  20016  4       119.1692 119.4762
    22000  22008  4       123.3813 124.1816
    25000  25000  4       122.6052 124.4356
    26000  26000  4       121.1415 121.9924
    27000  27000  4       119.8722 119.8722
    30000  30000  1       57.0225  57.0225 
    35000  35000  1       11.8061  11.8061 
    
    Residual checks PASSED
    
    End of tests
    
    Done: Mi 21. Dez 12:58:23 CET 2016
    

    Linux
    1. Linuxでのcronの4つの代替手段

    2. Linuxユーザーとは何ですか?

    3. パラメータをLinuxシステムコールに渡す方法は?

    1. さようなら、Linux Journal

    2. LinuxでSCPコマンドにパスワードを渡す方法

    3. Linux –異なるLinux / UNIXカーネルは交換可能ですか?

    1. パス–Linuxコマンドラインからパスワードを管理する

    2. Linuxmvコマンド

    3. Linuxduコマンド