(1)課題/背景
- PCクラスタ*1は複数台のPCをネットワークを介して接続してシステムを構成するメモリー分散型の並列計算機である。PC単体の性能向上は著しく、低価格化も進んでおり、非常にコストパフォーマンスの良い計算機でもある。このため、一部の先端的なユーザーが導入し、使い始めている。ハード、ソフト上絶大なコストパフォーマンスが得られる一方、一から十まで、自主独立・自己責任であるため、PCマニアでない普通の研究者が、PCクラスタを使うバリアは高い。さらに、自らの作業量をふくめたトータルコストを考えると、決して手放しで歓迎できるものではない。また、大規模な構成では小規模な構成では目につきにくい問題点も多々上がっている 。
- *1:市販されている普通のパソコンを集めたものと、ラックに設置するサーバータイプで構成されたものがある。
|
(2)目的
- 上記のような障壁や問題点は各サイトレベルでは解決が困難なことも多く、WGの活動を通して、保守サービスも含めた形で、なんらかの解決を図りたい。必要に応じ、適宜ベンダー側への要望をまとめる予定である。また、同時に中小規模のシステムでは効果がはっきりしているので、システムの設計や運用にあたっての注意すべきポイントを整理し、普及にも努力する。
|
(3)検討内容
- 大規模なシステムにおける問題点の抽出(例えば)
- ジョブのモニタリング、ロードレベライザーなどの管理ソフトが十分でない
- シリアルコンソールかモニター切り替え機か、リセットの手間
- 資産管理上の問題
- ベンダーのサポートが受けられない
- データ管理(NFSは数百台規模では動かなくなるなど)
- 今後のクラスタ用ハード/ソフトの動向調査
- サーバー用CPUの動向
- Myrinet、GbitEthernetその他、高速ネットワークの動向
- Linux/SCORE/MPI-CH(RWCPの今後なども含む)
- コンパイラー性能
- メモリーやチップセットの動向
- 規模による運用特性の違い
- 基本的にマルチ・ユーザーには向かないのか
- ユーザーに占有時間を与える運用方法の検討
- 規模による適正化は可能か
- 小規模のシステム導入のポイントの整理
- 中規模のシステム導入の注意点
- PCクラスターのリスク
- ハードウエアのトラブル
- ソフトウエアのトラブル
- トラブルにあわないための仕様書の作り方、ベンチマークの仕方
|
(4)活動内容
- 調査・ディスカッション
- (3)に示した内容はWG内だけでは十分な検討が行えないため、積極的に外部(新情報開発機構などの機関や、先端ユーザー、LINUX協会、インテルなど)に協力を求め、レクチャーやディスカッションを行ってゆく。この予定は事前に公開し、興味を持つ会員であればWGに限らず、参加できるものとしたい。
- 講演会の企画
- 広くPCクラスターを普及し、さらに関係者への影響力を増すために、SS研会員に限らない、広い層を対象としたPCクラスタに関する講演会を企画・運営する。(富士通本社の場所を借り、200人規模の講演会を年内に行う)
|
|