ホーム > イベント情報CD-ROMホーム > SS研HPCフォーラム2015 > 分科会レポート

SS研HPCフォーラム2015 分科会レポート
計算科学の新潮流(フロンティア)

執筆:澤 扶美 (理化学研究所 情報基盤センター)

はじめに

8月25日に「計算科学の新潮流(フロンティア)」と題しSS研HPCフォーラム2015が開催され、203名という昨年の同フォーラムを大幅に上回る参加があった。4つの講演とパネルディカッションがあり、文字通り「新潮流」を実感できる多彩な講演内容で、普段は接する機会が少ないが多くの参加者が興味を抱いていた計算科学が乗り込もうとする波をとらえる機会となった。

また、開会挨拶で本研究会の村上会長が計算機技術に対する「質的な変化への需要」と述べたように、対象分野の非理工系への広がりやHPCのビジネススキームの変化をコミュニティ全体で捉えて行くためにも、今回のようなテーマ設定は一助になるものであり、多くの方に多忙な中集っていただくことができた。

『AIグランド・チャレンジ「ロボットは東大にはいれるか」が投げかけるもの』
  穴井 宏和 (国立情報学研究所 / 九州大学 / 富士通研究所)

最初の講演は、AI関連のプロジェクトのなかではIBMのワトソンのニュース記事と同じくらい見る機会がある「AIが東大受験をする」という、一般の方も興味を持っている方が多いプロジェクトに関する講演であった。親しみを込めて「東ロボくん」と呼ばれているこのAIは、国立情報学研究所がディレクションを行う研究プロジェクトで開発が進んでおり、2021年に東大入試を突破するという明確かつ大胆な目標を掲げ話題を集めている。複数の研究機関、企業から80名程度の人が集まる大規模なプロジェクトとなっているが、「入試」という人間が処理しうる様々なタイプのタスクが含まれる課題に取り組むにあたり、得意なことと苦手なことが明確に分かれている状況で、まだまだ不足している要素技術があるとのことであった。ただ入試は全問正解をする必要は無いため、一見夢物語のように聞こえるプロジェクトであるがAIの課題設定として適しているとわかった。講演者が数学を担当しているため、数学についての「東ロボくん」の現状が詳細に報告された。

東ロボくんの入試問題の解法は、入試問題の読解、すなわち自然言語処理から始まる。このために入試数学用語の単語帳を用意している。その後、論理式に変換を行い数式処理アルゴリズムQE(限量記号消去法)で答えを導き出す。自動生成される論理式は、冗長であることもあり、数式処理の際の計算量に影響を及ぼす。同じ解法を人間が参考にできないのか、という質問が講演後出ていたが人間が処理する(解く)ことは困難であることと、「入試問題」という性格上、教育的意味が希薄ではないかとの見解であった。

自然言語処理を行い論理式に変換していくという仕組み上、問題理解の最初の過程で、機械での認識が難しい問題が多い確率統計や、図などの幾何的な情報から出題意図を読み解く問題は「苦手」であり、今後の課題であるが、入試は全問回答、全問正解を求めるものではないということから「得意分野を伸ばす」という方向性もあるとのことだった。

現在、東大入試の模試の偏差値が60程度であるが、センター試験のほうが出題の形式上回答を導き出すことが難しく、いわゆる「足切り」に遭うレベルである。しかしながら模試の成績では、日本にある476の大学について「合格」という判定が出ている。

「東大入試」という一般の方も強く興味を持つ対象でしばしばニュースで取り上げるプロジェクトであり、今後の動向に注目したい。

『SuirenでのHPL及びアプリ性能について(+Shoubuの話)』
  似鳥 啓吾 (理化学研究所)

午前中2つ目の講演は、7月に発表されたGREEN500でトップ3を独占し、大きな話題となったPEZY-SCを搭載した液浸冷却小型スーパーコンピュータExaScalerでの性能評価についての講演であるが、前半でハードウエアの説明も行われた。

PEZY-SCは、1024コアのMIMDプロセッサで倍精度1.5Tflopsの理論性能を有する国産プロセッサである。講演者ご自身も「本当にそうなんです。」と念押しされていたが、誰しも最初に聞いた時は驚く仕様である。アクセラレータのような使い方を想定したプロセッサであり、キャッシュコヒーレンシは無くGPUに似たものという説明だった。

プログラミングモデルは、OpenCLのサブセットとして独自のPZCLが用意されている。感覚としてはGPUのプログラミングに似ているが、1024x8=8192スレッドがすべてMIMDで動作する。I/Oについて講演者は「モンスター級」と表現されていたが、PCI expressGen2/3x8が4ポート、DDR3/4 8ch 合計512bitが実装されていて、これは京やFX10に相当するものである。

Suiren(ExaScaler-1)の筐体がSupermicro社の製品を改造したしたものであるのに対し、Suiren Blue、Shoubu(ExaScaler-1.4)のブリックは、マザーボードから独自に設計した高密度実装のハードウエアとなっている。これは、冷却に使用するフロリナート(住友スリーエム社製フッ素系不活性液体)が非常に高価であり、それを有効に使うために実装密度を上げる目的があったとのことである。結果的にメンテナンスが行いにくい構造になった部分もあり、作業時のご苦労を述べられていたが想像に余りある。理化学研究所に設置されているShoubuは5つの液浸槽に最大80ブリック(320ノード)インストールができるが、6月の性能測定は60ブリックで行われた。ノード間はファットツリー構造で接続されているが、36ポートのスイッチを分解し液浸化して使用している。

使用したHPLコードは、講演者の上司である牧野淳一郎氏がGRAPE-DR のために書き直した「lu2」がベースになっており、それをPEZY-SC用に変更したとのことだが、2014年10月にSuirenで実行するため、まずGRAPE-DRよりメモリが大きいことが活かせるよう変更を行った。その後、2015年6月にSuiren bule、ShoubuでのSuirenからのハードウエア仕様の変更を受けコード変更を行い、性能評価を行った。GREEN500のエントリールールでは、TOP500の500位にあたる浮動小数点演算性能があることが要求されるが、最初に設置されたSuirenはなんとか昨年11月のGREEN500のサブミットの資格を得ることができ、また今年6月には1位から3位までを ExaScaler が独占することとなった。28nmプロセスで製造されたMIMDメニーコアのPEZY-SCが、同じ28nmのGPUを電力効率で上回ることができたのは講演者自身驚いたとのことである。

2015年4月からは、PEZY Computing社と協力研究機関でLattice QCD on PEZYの開発を行っている。倍精度ソルバーの前処理に単精度ソルバーを使うなど、GPU版と同じ方式をとっており、現在代表的な格子作用を移植中とのこと。

MIMDが活用できるアプケーションが今後もっと出てくることが期待される。

余談ではあるが、筆者はShoubuの設置から性能測定に至る期間、講演者を含む関係者の作業を間近で拝見していたが、研究者と技術者が連日冷却液にまみれて昼夜問わず必死で作業をされていた。2015年のGREEN500は通過点であるとも言えるが、目覚ましい結果を出されたことに敬意を表したい。

『ステンシル系プログラムによるFX100の性能評価と高速化チューニング』
  高木 亮治 (宇宙航空研究開発機構)

2014年10月にJAXAの二代目のスーパーコンピュータであるJSS2が稼働を開始し、2015年4月にその中核システムとして、富士通製FX100、システム名SORA-MA(Supercomputer for earth Observation, Rockets and Aeronautics MAin)が稼動を開始した。この理論演算性能1.31Pflopsの大規模超並列計算機であるSORA-MAでの、航空宇宙分野のCFDプログラムの性能評価と高速化についての実践的な報告があり、質疑応答でも活発な議論が行われた。

STREAM(TRIAD)については配列の種類(静的、動的、ポインタ)によって性能が変わり、ポインタ配列では性能が悪くなることがわかった。また、使用Thread数とMemory Performanceの関係では、まだ解釈ができていないところがあり、富士通と調査中である。

ステンシル系プログラムであるUPACS-Lite(圧縮性流体解析プログラム)について、スレッド数によるスケーラビリティを評価したところ、8スレッドまでは良好なスケーラビリティが得られた。

1ノードでの計算規模を変えたHybrid-MPIとFlat-MPIの並列性能比較を行い、以下の様な結果が得られたが、予想と異なる点もあった。

FX1、FX10、FX100での性能比較では、ソフトウエアのチューニングも行えばFX100ではFX1の概ね32倍の性能が得られた。ソフトウエアのチューニングを行わない場合も最速で16倍の性能が得られたのと報告であった。

高速化チューニングの概要であるが、オリジナルからAの段階でIA機との違いがあり、IA機では性能の劣化が見られた。FXシリーズとIA機で同じ手法では高速にならない部分があることが確認できたが、利用者にとってはこのような違いがあることは注意すべきであるとの示唆があった。

質疑応答の中で性能の計測結果について一般的な解釈と実測に矛盾があるように思われるという指摘があったが、講演者側からも富士通側でないと原因がわからないという見解があり、富士通からはこういった問題について積極的に情報収集を行い調査したいと申し出があった。

今後他のFX100利用機関も含め、富士通との情報交換が密に行われ、高速化のための知見が蓄積されていくことに期待する。

『富士通のHPCに向けた取り組み』
  新庄 直樹 (富士通株式会社)

最後の講演として富士通株式会社からのHPC事業全体に関する報告があった。

TOP500の上位10システムについて、4システムはアクセラレータ搭載で9システムは専用のインターコネクトが使われている。このことからも、TOP10に入る程度のスーパーコンピュータには「特別な取り組み」が必要であるとの認識を示した。

一般的に言われているような半導体の微細化の限界は見据えているが、3次元化などの方法でさらなるメニーコア化の傾向は続き、アプリケーションとの適合性も考えれば、高性能なコアを適切に配置するアプローチが良いと考える、と述べた。

今後のHPCの利用では欠くことのできない省電力対策への取り組みの長期的なロードマップを示した。ジョブを使用していないコアのまとまりをつくり、その部分の電力使用を抑える(2020年)、最終構想では計算機だけではなく設置しているセンター全体での消費電力コントロールするといった興味深いものであった。実現に大いに期待したい。

『パネルディスカッション「拡がるHPC」』
  コーディネータ 小柳 義夫 (神戸大学)

以下にパネリストからの研究紹介の要約を列記する。

「大規模航空ネットワークの全体最適な運用に向けて」
  西成 活裕 (東京大学)

近年深刻な問題になっている航空機の遅延解消を目指した研究を行っている。現在地球上を運行している旅客機は約20,000機で、20年後には38,500機に増えると予想される。遅延を解消する仕組みを構築することが急務である。鍵となるのは、飛行中の機の運行管理であり管制官が決定することができるという点で自動車の交通管理とは大きく異なり、仕組みを作れば効果が大きいことが期待できる。課題は拘束条件が非常に多いことであるので、その処理にはHPCの寄与が期待される。

「京コンピュータを用いた大規模な経済ネットワーク解析とその可能性」
  藤原 義久 (兵庫県立大学)

実体経済に関わるデータとして、経済ネットワークについての大規模なデータが提供されている。「小数の巨人と非常に多くの矮人」と例えられるように、経済主体の異質性とそれらの依存関係の中で生じる小さな事象が大きな変動をもたらすという相互作用に関する実証的データから新たな知見が得られている。より高度な解析のためのHPC利用を検討すべく大規模な計算環境の利用を模索している。

「避難シミュレーションの精緻化と大規模化の取り組み」
  安福 健祐 (大阪大学)

より妥当性のある避難シミュレーションの開発には、人間の避難行動モデルの精緻化が不可欠であり、それにともなう計算量の増加に対応するため、並列化など難しい課題はあるがHPCの利用の可能性を探っていくべきである。またシミュレーション結果の妥当性の検証方法の検討や結果を説明するための可視化が不可欠である。

「社会現象へのHPCの応用」
  伊藤 伸泰 (東京大学 / 理化学研究所)

交通・経済・社会関係など、条件が複雑に連携し、気候・災害なども密接に関連する社会現象全体は、システムがさらにシステムを作るという複合系であり扱いが難しい。パラメータの数も膨大であり経路や戦略の選択といったように離散的なパラメータも多く扱いづらい面が多い。こういった問題をHPCで解決する道筋を探りたいというのは長年あった考え方であるが、昨今実際の計算をしたい規模に計算機が追いついてきている。

以上がパネリストからの研究紹介である。

ディスカッション

ディスカッションでは、まず、それぞれの研究でボトルネックになっているのは何かについて議論された。伊藤氏からは、それぞれの分野とHPCの知識やスキルを両方持った人材が居ないことが指摘された。計算量についての問題は、計算機のスペックがどんどん上がっていくことで解決が予測できるのに対して、人材面の問題については解決に知恵を絞るべき問題であるが、日本は欧米よりこういった社会科学など、理工系以外の知識とHPCの知識があるような人材を育成する取り組みが遅れているということについて、パネリストから同意を得ていた。

また、解析結果のバリデーションについての議論では、答え合わせが要求されているのではなく「こうあるべき」という示唆の要求のほうが強いという意見があった。社会科学の側でも比較すべき「正解」を持つに至っていないことも多いことが指摘された。社会科学は計算機科学よりも長い歴史があるが、新しい答えを探す方法として、データやIT技術を使う方法を探すべきという協調への道筋が確認された。

会場からは、京コンピュータのような計算資源の利用をいきなり検討するのではなく、クラウドを利用することは考えないのかという質問があった。扱う処理の量が急増することは明確だか、どの処理にどちらのタイプの計算機が適するかがまだ検討段階である分野が多くあるが、シナリオが数百万といった規模を越えるようなものは現状のクラウドでは処理が困難ではないかという意見が出た。

社会問題の科学的分析について、誰もが興味がある政策決定者への働きかけについての質問も会場からあった。パネリストからは、経験的に「因果関係」が明確になっている情報が好まれる傾向があり、複雑な事象であれば可視化が不可欠な要素であると回答があった。理工系の問題とは異なり、唯一の正解ではないという点が注意点であるとの指摘も有った。

最後に、有史以来人類が取り組んできたはずである「社会の問題」について、知識と技術がある者が協力して解決に向けた努力をするという見解に至った。

おわりに

閉会挨拶では、理化学研究所情報基盤センター長の姫野龍太郎氏から、今回の分科会で新しいトピック、新しい計算科学の切り口を選んだことで、多様な分野の多くの方が集まり活発な議論がなされたことに謝意が述べられ、閉会となった。

懇親会も多数の参加があり、講演についての議論が活発に行われ有意義なものであった。

以上

SS研について

イベント情報

研究会活動

資料アーカイブ

情報発信

リンク集




鍵マークがついている情報の閲覧にはWebサイトIDが必要です。登録/変更ページへ
Webサイト閲覧時にIDが必要なページには、鍵マークが付いています(当CD-ROM内では不要)。
コンテンツの最新/詳細情報は、SS研Webサイトをご覧下さい。
All Rights Reserved, Copyright© サイエンティフィック・システム研究会 1996-2024