アクセラレータ技術WG 成果報告書
[2012-03-26発行]
※本資料はオープン資料です。SS研会員機関に限らず、広くご活用ください。
報告書 PDFデータ [6.04MB]
1. はじめに
1.1. 背景と目的
1.2. メンバー
1.3. 活動経緯
2. ディレクティブ方式によるGPU利用
2.1. PGI Accelerator概要
2.2. PGI AcceleratorによるプログラムGPU化事例
2.2.1. 事例1:姫野BMT
2.2.2. 事例2:2D-FDTD
2.2.3. 事例3:分子軌道法(ERI-MO)
2.3. まとめ
3. アクセラレータ向け拡張言語によるGPU利用
3.1. CUDA概要
3.2. CUDAによるプログラム最適化事例
3.2.1. 事例1:分子軌道法(ERI-MO)
3.2.2. 事例2:Linpack
3.3. OpenCL概要 (CUDAとの比較)
3.3.1. OpenCLとCUDAの性能比較
3.3.2. OpenCLのポータビリティ
3.4. まとめ
4. ハードウェア動向
4.1. 新旧nVidia GPUアーキテクチャ比較
5. おわりに
添付
- (資料 1) コーンビーム再構成の高速化
- (資料 2) 初心者によるGPUプログラミング事例
- (資料 3) GPUを搭載したスパコンTSUBAMEにおけるLinpackベンチマーク
- (資料 4) PGIアクセラレータコンパイラについて
- (資料 5) 複合型計算機向けソフトウェア開発環境SPRATのご紹介と性能評価
- (資料 6) GPGPUプログラミングの状況 - PGI Accelerator -
- (資料 7) OpenCLの評価 - 最適化の観点から -
- (資料 8) CUDA and OpenCL
- (資料 9) nVidia新GPUの調査報告(FermiのCache評価)
- (資料10) PGIコンパイラでの自動並列化制限ならびにCUDAによるアプリケーション性能評価
- (資料11) アクセラレータを使った大規模システム導入にあたっての課題“RICCの場合”
- (資料12) TSUBAME2.0におけるGPU運用(とLinpack)
- (資料13) Hartree-Fock-Roothaan 量子計算プログラム概説
- (資料14) PGIアクセラレータコンパイラによるFortran 2D-FDTDの性能評価