(1/8)
アブストラクト GRAPE-DRは 512個の演算ユニットを 1チップに集積し、単精度 512Gflops、倍精度 256Gflopsのピーク性能を持つ超並列プロセッサである。これまで東大で開発されてきた天文シミュレーション専用計算機 GRAPEの後継機だが、重力計算用の専用パイプラインではなくプログラマブルな SIMDプロセッサを採用した。2008年度には、単精度 2Pflopsのピーク性能を持つシステムを構築する計画である。講演では GRAPE-DRの意義、HPC用システムの将来像にも触れたい。 キーワード GRAPE、超並列アーキテクチャ、ヘテロジニアス・マルチコア、専用アーキテクチャ
GRAPE-DRは、我々が開発した 1チップ超並列プロセッサである。1クロックサイクルに浮動小数点乗算と、浮動小数点加減算(または整数演算)の 2演算を独立に行う演算コアを 1チップに 512個集積し、500MHz動作させることで 512Gflopsの理論ピーク性能を実現した。但し、パイプラインスループット 1で実行できるのは単精度実数と倍精度実数の乗算であり、倍精度実数同士の乗算ではスループットが半分になる。加減算は常に倍精度実数に対して実行されるが、倍精度実数同士の乗算では 2サイクルに 1度加減算器も使うために倍精度実数乗算を実行中には乗算器、加算器ともにスループットがクロック当り 0.5になり、ピーク演算速度は 256Gflopsに低下する。この、倍精度でピーク演算性能が 256Gflopsという数字はこの原稿を執筆している 2007年 11月初めの時点で世界最速である。 本稿では、まず、我々が GRAPE-DRを開発するにいたった背景を、計算機アーキテクチャの進化一般の観点、我々が従来開発してきた重力多体問題専用計算機 GRAPEの方向性の観点からまとめ、GRAPE-DRのアーキテクチャ、性能について簡単にまとめた後、他のいくつかのアプローチ、具体的には FPGAを使った再構成可能計算、GPGPU、汎用マイクロプロセッサを使った並列計算等と比較する。