(6/8)6.さらなるパフォーマンスの向上
更にパフォーマンスを向上させるためには何を変更すると効果的か考えた場合
- CPUをより高速な物に換える
- ネットワークを高速な物を用いる(Myrinet)
- 商用コンパイラを用いる (Fujitsu Fortran & C Package)
- ユーザレベル通信を用いる(Score+PM Ver2.4)
- 領域分割を2次元にする
- 台数を増やす
- 通信と計算を同時に行う
結果をまとめると、
一方、問題点としては
- 富士通製コンパイラはフリーのものに対して、価格に見合う性能向上が認められる
- 16台までは問題なく、充分速くなる
- MPIでのソフトの書き直しは、パターンさえ理解すると簡単で機械的
- うまく作ると元のプログラムと差がない
- 初期・境界条件のサブルーチンに差を凝縮
- 増やしていくと飽和するようになるが、通信の工夫や高速なネットワークにすることで克服可能
- 領域分割は、分割方法によって速度に違いがでる
- 3次元分割は台数が少ないと効果が低く、むしろ1次元分割が手間の割りに効果が高い
- PCクラスタでは通信量より、通信の回数が重要
- 計算している最中に通信をするよう、計算を分割すると、台数効果が高くなる
- 性能向上が激しく、6ヶ月後に同じCPUが手に入らない
- 導入して1年が旬、2年で更新の必要
- 自分で構成するには、それ相応の知識(調査)が必要
- ターンキーシステムも利用可能だが、その分高い
- 自分で組むのなら32台まで(できれば16台くらいが妥当)
- 64台以上だと維持も更新も手間が大変
- 故障時の予備を持つ必要がある