SSブログ

Raspberry Pi 4B Benchmark [Raspberry Pi]

まだ、計算してはレポートにまとめるという作業を続けている。もう会社の誰にも理解してもらえなくて、難しい。できれば専門家に相談したい。それには会社のみんなの合意を得る必要があるんだけど、そのずっと手前で議論が進まない。だんだんめんどくさくなってくる。

まあそれはそれとして、でも技術的にはそれとのからみがあって、Raspberry Pi 4Bを買った。今手元にPi 3Bが売るほどあるんだけど、確認したいことがあった。買ってすぐに、Raspbian付属のMathematicaの実行速度比較をみてみた。ところで今はRaspbianではなくてRaspberry Pi OSだそうである。64ビット版に備えてということらしいけど、なんかmacOSみたい....

そういえばbusterからMathematicaが標準インストールされなくなったようである。やっぱりデカいからだろう。それでも
$ sudo apt install wolfram-engine
とすれば今日時点で12.0.1がインストールされる。Mathematicaには昔から専用のベンチマークがあって
Needs["Benchmarking`"];
BenchmarkReport[]
で一昔前の一般的なマシンとの比較がきれいにレポートされる。このベンチマークは15種類の計算をしてそのCPU時間(AbsoluteTiming[]関数で)で比較している。ほとんどが機械精度数値計算に関するもので、すべて単一カーネルによっている。したがって実質的にほぼシングルコアのベンチマークである。

これを
  • Raspberry Pi 3B
  • Raspberry Pi 4B 2GB
  • Macbook Pro 13" late 2013/2.4GHz 2cores i5/8GB
  • iMac 21.5" 2019/3GHz 6cores i5/16GB
の4つで比較してみた。ただし、MathematicaのバージョンはRaspbianでは12.0.1で、macOSでは12.1.1で、微妙な違いがある。

まずトータルスコア(ほぼそのまま実行時間秒)。ログプロットしないといけないぐらいになった。
0719benchmark1.png
4Bは平均で3Bの約4割ぐらいの実行時間になっている。思ったよりも成績がいい。ちなみに古いMBPと新しいiMacでも同じくらいの性能差がある。

15種類の計算ごとのPi 3Bに対するPi 4Bの計算時間の比をとったのがこれ。
0719benchmark2.png
違いが大きいのは15種類のうちの4番の大きな行列の固有値の計算と、11番の数値積分。逆に違いが少ないのが10番の行列の転置。機械精度の浮動小数点演算に差が出てメモリを扱うのはそれほど違わない、ということだろうか。

ついでにiMacとの比をみたのがこれ。
0719benchmark3.png
ほとんどで4BはiMacに比べて一桁以上遅い、ということだけど、とくに9番の行列の積が極端に遅い、ということになった。それと3番は1,200,000点の1次元Fourier変換で、メモリの遠い場所でのアクセスで差が出てるということだと思われる(ちなみにRaspberry Piでベンチマークの間にページアウトがないことは確認している。つまりこの差はストレージアクセスとは関係ないということ)。

しかし、3BとMBPはハードウェアの値段の比と同じくらいの性能だったのが、4Bでは単純にハードウェア単価あたりの性能はMBPを超えてiMacも凌ぐ、とも言える。Mathematica用にハードウェアを最適化して他を切り詰めたWindowsでなんとか超えられるか、というぐらいだと言っていいだろう。今後、Wolfram Researchがpi用のはパフォーマンス調整するとか、バージョンをあげないようにしていつの間にかファイドアウト、なんていうことをしないように希望する。

ところで、4BのSoCはめちゃ熱くなる。ベンチマークを走らせてると、火傷しそうなほどでとても触れない。暴走しないまでもクロックが勝手に下がったりしたらベンチマークにならないと思って、こんなふうに
0719cooling.jpg

ビニール袋に冷凍庫から四角い氷をひとつと、ちょっとだけ水を入れて、CPUのパッケージに乗せた。みるみるうちに氷が溶けていった。部屋の温度にもよるとは思うけど、面白いぐらいのスピードで溶けた。amazonなんかで売られている、カッコだけのヒートシンクセットなんて気休めにもならないんじゃないだろうか。子供も使う製品だと考えると、熱設計がちょっと甘かった、とも思える。

これの反省からもっとTDPのいいSoCを積んだRaspberry Pi 5Bとかがさくっ、と出ると嬉しいんだけど。4BのCPUコアはCortex-A72だそうで、周回遅れというほどではなくなってきている。これ以上パフォーマンスやTDPを上げようとすると値段を上げざるを得ないかもしれない。メモリの選択肢も増やしたので、Zero系列、通常版、高パフォーマンス版、とかに細分化するしかないんだろうか。
nice!(0)  コメント(0) 

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。