Scientific System研究会Home スカラ並列技術WG 〜成果報告書〜
スカラ並列技術WG TOPに戻る

成果報告書 本文: report [2.24MB]key
別冊: 別冊スカラ並列プログラミング チューニング・ガイド [441KB]key
(冊子をご希望の方は、事務局までご連絡ください。在庫があればお送りします)

− 目 次 −
1. はじめに

1.1 背景と目的
1.2 WGメンバ
1.3 検討経緯

2. 活動概要と評価のまとめ

2.1 各プログラムの検討概要
  2.1.1 名古屋大学 -名大BMT-
  2.1.2 理化学研究所(1) -姫野BMT-
  2.1.3 理化学研究所(2) -有限要素法-
  2.1.4 宇宙科学研究所(1) -プラズマ粒子シミュレーション-
  2.1.5 宇宙科学研究所(2) -圧縮性流体-
  2.1.6 航空宇宙技術研究所 -チャネル流乱流遷移-
  2.1.7 産業総合技術研究所 -分子動力学法-
  2.1.8 国立遺伝学研究所 -遺伝子ネットワークの推定-
2.2 評価のまとめ
2.3 検討の中で出たコメント・提言、それに対する回答

3.各プログラムの評価(詳細報告)

3.1 名古屋大学 -名大BMT-
   <関連情報>
     ・名大プログラム4の性能ネックについて
     ・名大BMTプログラム ジョブ4の性能について
3.2 理化学研究所(1) -姫野BMT-
   <関連情報>
     ・dtimeサービスルーチンについて
     ・姫野プログラムの並列台数効果問題について
     ・タイマルーチンの精度・オーバーヘッドについて
3.3 理化学研究所(2) -有限要素法-
3.4 宇宙科学研究所(1) -プラズマ粒子シミュレーション-
3.5 宇宙科学研究所(2) -圧縮性流体-
3.6 航空宇宙技術研究所 -チャネル流乱流遷移-
3.7 産業総合技術研究所 -分子動力学法-
3.8 遺伝学研究所 -遺伝子ネットワークの推定-

4. 関連情報
4.1 評価環境 -GP7000の概要-
4.2 技術情報
     4.2.1 自動並列化の現状
     4.2.1.1 現状の自動並列化能力について
     4.2.1.2 並列実行時の効率(オーバヘッド)について −粒度の問題−
     4.2.1.3 自動ベクトル化と自動並列化
     4.2.2 ループ再構成の最適化について
     4.2.3 並列化を阻害する要因
     4.2.4 Parallelnaviのラージページ機能について
     4.2.5 Parallelnaviの新ツール
     4.2.6 CPUの割当について
     4.2.7 大規模SMPサーバのスケーラビリティ
     4.2.8 MPI PingPongプログラムの性能について
4.3 スカラ並列プログラミング チューニング・ガイド (別冊)

5. NetLaboratoryの活用

6. おわりに


別冊「スカラ並列プログラミング チューニング・ガイド」目次
第1章 はじめに
1.1 本ガイドの範囲と利用方法
1.2 性能チューニング作業のながれ
第2章 ハードウェアの特徴
2.1 PRIMEPOWERの構成
2.2 高速化(並列化)の方式
第3章 性能分析
3.1 性能分析の概要
3.2 実行時間の計測
3.3 プロファイラ
第4章 高速化を阻害する要因
4.1 スカラ性能の阻害要因
4.2 並列性能の阻害要因
4.3 チューニングの目安
第5章 スカラ性能のチューニング
5.1 コンパイラによる最適化
5.2 オプションによるチューニング
5.3 OCLによるチューニング
5.4 ソースチューニング
5.5 ラージページ機能
第6章 並列化(自動並列化)
6.1 自動並列化とは
6.2 オプションによるチューニング
6.3 OCLによるチューニング
6.4 -Qmオプションによるチューニング
第7章 並列化(OpenMP)
7.1 OpenMPのAPI解説
7.2 OpenMPの使い方
7.3 OoenMPの使用事例
7.4 チューニング
第8章 メッセージガイダンス
スカラ並列技術WG TOPに戻る