買いした。スペックは大体こんな感じ。
CPU: core i7 4770K 3.5GHz
メモリ: 32GB
HDD: 2TB x2 (SSD は Linux で使う場合に不安があったので敢えてつけず)
GPU: GeForce GTX780
本当は Titan を買って倍精度浮動小数点を使いたかったのですが、思いきれませんでした...
が、以前使っていたカードが GT 640 だったこともあり、速さは段ちでした。
試しに nbody シミュレーションデモを動かすと個体数 32K くらいまではさくさく動く。
さすがに 64K は辛そう。GT640 では 16K が限界だったので、最低2倍は速いということか。
Kepler アーキテクチャ(CUDA5以降)ではカーネルから別のカーネルを呼び出せるそうなので、
そのうちやってみよう。CPU の AVX2 の性能を測るため、nbody を fpu と avx2 で書き直したプログラムでも比較してみました。
結果、avx2 は fpu より2〜3倍くらい速かった。
でも GPU は avx2 より10倍速かったのです。
CPU の次のバージョンでは AVX が 512 ビットになるそうですが、GPU との差は縮まるのか??
タグ:CUDA