−司会− 高エネルギー加速器研究機構計算科学センター 石川 正
- 【司会】
- ご報告していただいた内容について質問、コメント等をお願いします。
- 【根本】(アトムテクノロジー研究体)
- チューニングされるときのことですが、コードによって使える使えないというのがあるかと思いますが、LAPACK、並列版の ScaLAPACK等のライブラリを使ってチューニングされることもあったのでしょうか。
- 【根本】(発表者:日本原子力研究所)
- あまりないですね。並列化ライブラリは、原研ではあまりありません。特に東海研究所ではほとんど使っておらず、チューニングもしていません。
- 【根本】(アトムテクノロジー研究体)
- いままでの経験で、並列化のことですが、8並列か 16並列くらいまではたぶん有効だと思うのですが、アムダールの法則で、16くらいから頭落ちします。ご報告いただいた非線形フォッカープランクコードの場合、ベクトル化の並列化で、例えば 4PEの並列版の場合は、1PEのベクトルから比べて約半分近い 50%くらいきいているわけですね。8PEにした場合は 7分ちょっと、16PEを使った場合は、8PEから比べると 2分ちょっとですね。そういう場合、ユーザには何並列がいいですよとか、16並列で 16分より、資源の有効利用を考えると 8並列で 19分の方がトータル的に見るといいようにも思うのですが。
- 【根本】(発表者:日本原子力研究所)
- 2つあると思います。1つは、高速化から言えば 8PEか 4PEで十分だと思います。その場合はユーザに 4PEか 8PEでいいですよと勧めています。
もう 1つ規模拡大といってメモリに載らない場合には、16PEしか動かないということがあります。そういうときはしかたがないので、16PEで流してくださいということになります。実際、最近は解析規模が結構大きくなっています。このコードの場合は、ベクトル化でかなり高速化はできていますので、解析できないよりはできた方がいいだろうということで 16PEを勧めています。実際、以前このプログラムはほとんど 16PEで動かしていました。いまはその必要がなくなりましたが、たまに実行するときは4PEくらいで実行しています。
- 【司会】
- 時間がまいりました。根本さんと久米さん、ありがとうございました。(拍手)