目次]   [1ページ目] [前ページ] [次ページ]  [Q&A
科学技術計算分科会「サイエンティフィック・コンピューティングの最前線」

「GRAPE-DRとスーパーコンピューティングの未来」


(1/8)

論文 PDF file (16KB)
プレゼンテーション資料 PDF file (1.6MB)

【論文目次】
1.はじめに
2.背景. 計算機アーキテクチャの「進化」
3.GRAPEとその発展
4.GRAPE-DRへ
5.アプリケーション
6.類似アプローチとの比較
  6.1 FPGA
  6.2 GPGPU
  6.3 ClearSpeed CSX600
  6.4 タイルプロセッサ等
7 HPC の今後
参考文献
写真

国立天文台
牧野 淳一郎
アブストラクト
  GRAPE-DRは 512個の演算ユニットを 1チップに集積し、単精度 512Gflops、倍精度 256Gflopsのピーク性能を持つ超並列プロセッサである。これまで東大で開発されてきた天文シミュレーション専用計算機 GRAPEの後継機だが、重力計算用の専用パイプラインではなくプログラマブルな SIMDプロセッサを採用した。2008年度には、単精度 2Pflopsのピーク性能を持つシステムを構築する計画である。講演では GRAPE-DRの意義、HPC用システムの将来像にも触れたい。

キーワード
GRAPE、超並列アーキテクチャ、ヘテロジニアス・マルチコア、専用アーキテクチャ


1.はじめに
GRAPE-DRは、我々が開発した 1チップ超並列プロセッサである。1クロックサイクルに浮動小数点乗算と、浮動小数点加減算(または整数演算)の 2演算を独立に行う演算コアを 1チップに 512個集積し、500MHz動作させることで 512Gflopsの理論ピーク性能を実現した。但し、パイプラインスループット 1で実行できるのは単精度実数と倍精度実数の乗算であり、倍精度実数同士の乗算ではスループットが半分になる。加減算は常に倍精度実数に対して実行されるが、倍精度実数同士の乗算では 2サイクルに 1度加減算器も使うために倍精度実数乗算を実行中には乗算器、加算器ともにスループットがクロック当り 0.5になり、ピーク演算速度は 256Gflopsに低下する。この、倍精度でピーク演算性能が 256Gflopsという数字はこの原稿を執筆している 2007年 11月初めの時点で世界最速である。
  本稿では、まず、我々が GRAPE-DRを開発するにいたった背景を、計算機アーキテクチャの進化一般の観点、我々が従来開発してきた重力多体問題専用計算機 GRAPEの方向性の観点からまとめ、GRAPE-DRのアーキテクチャ、性能について簡単にまとめた後、他のいくつかのアプローチ、具体的には FPGAを使った再構成可能計算、GPGPU、汎用マイクロプロセッサを使った並列計算等と比較する。

目次]   [1ページ目] [前ページ] [次ページ]  [Q&A

All Rights Reserved, Copyright©サイエンティフィック・システム研究会 2007