[目次] [発表資料]

質疑応答「原研における原子力コード高速化への取り組みとプログラミング事例」


−司会− 高エネルギー加速器研究機構計算科学センター 石川 正

【司会】
ご報告していただいた内容について質問、コメント等をお願いします。

【根本】(アトムテクノロジー研究体)
チューニングされるときのことですが、コードによって使える使えないというのがあるかと思いますが、LAPACK、並列版の ScaLAPACK等のライブラリを使ってチューニングされることもあったのでしょうか。

【根本】(発表者:日本原子力研究所)
あまりないですね。並列化ライブラリは、原研ではあまりありません。特に東海研究所ではほとんど使っておらず、チューニングもしていません。

【根本】(アトムテクノロジー研究体)
いままでの経験で、並列化のことですが、8並列か 16並列くらいまではたぶん有効だと思うのですが、アムダールの法則で、16くらいから頭落ちします。ご報告いただいた非線形フォッカープランクコードの場合、ベクトル化の並列化で、例えば 4PEの並列版の場合は、1PEのベクトルから比べて約半分近い 50%くらいきいているわけですね。8PEにした場合は 7分ちょっと、16PEを使った場合は、8PEから比べると 2分ちょっとですね。そういう場合、ユーザには何並列がいいですよとか、16並列で 16分より、資源の有効利用を考えると 8並列で 19分の方がトータル的に見るといいようにも思うのですが。

【根本】(発表者:日本原子力研究所)
2つあると思います。1つは、高速化から言えば 8PEか 4PEで十分だと思います。その場合はユーザに 4PEか 8PEでいいですよと勧めています。
もう 1つ規模拡大といってメモリに載らない場合には、16PEしか動かないということがあります。そういうときはしかたがないので、16PEで流してくださいということになります。実際、最近は解析規模が結構大きくなっています。このコードの場合は、ベクトル化でかなり高速化はできていますので、解析できないよりはできた方がいいだろうということで 16PEを勧めています。実際、以前このプログラムはほとんど 16PEで動かしていました。いまはその必要がなくなりましたが、たまに実行するときは4PEくらいで実行しています。

【司会】
時間がまいりました。根本さんと久米さん、ありがとうございました。(拍手)

[目次] [発表資料]