[科学技術計算分科会代表報告]
世界最深度のメタゲノム解析を可能にする超並列パイプラインの開発
講演者
秋山 泰
東京工業大学 大学院情報理工学研究科 計算工学専攻 教授
- [略歴]
-
- 1990年 慶應義塾大学大学院博士課程修了 工学博士
- 1990年〜1992年 電子技術総合研究所 研究官
- 1992年〜1996年 京都大学化学研究所 助教授
- 1996年〜2000年 新情報処理開発機構 研究室長
- 2000年〜2001年 電子技術総合研究所 主任研究官
- 2001年〜2007年 産業技術総合研究所 生命情報科学研究センター センター長
- 2007年〜現在 東京工業大学 教授
- 2011年〜現在 東京工業大学 情報生命博士教育院長
- [研究分野、研究テーマ]
-
- バイオインフォマティクス(ゲノム配列解析、タンパク質間相互作用予測、薬物動態解析、質量分析、等)
- 並列分散アプリケーション
- 機械学習
- [所属学会、受賞歴、著書など]
-
- 並列生物情報処理イニシアティブ 理事長
- バイオスーパーコンピューティング研究会 理事
- 日本バイオインフォマティクス学会 理事
- 人工知能学会 元理事、情報処理学会、薬物動態学会
アブストラクト
DNA配列の読取コストは最近数年で4桁下がり、数千人のヒトゲノム解析、体内や環境内の微生物の網羅解析も可能となったが、情報解析が律速である。未知現象の研究には配列間の弱い類似性を検出する「深い」検索が必要だが、テラバイト級の大量配列に高感度解析を行うのは不可能とされてきた。我々は、既存のBLASTXより約百倍高速なアルゴリズムを提案し、ハイブリッド並列化により「京」の全系までスケール可能なGHOST-MPシステムを開発した。2年前の技術では16年かかる計算が、「京」の全系では2日間で完了する。
キーワード
ゲノム解析, メタゲノム解析, 配列相同性, 「京」コンピュータ, MPI, OpenMP
資料
プレゼン資料[3.7MB]
講演後Q&A