[話題1]KGTのクラスタ対応 可視化システムへの取り組み : 宮地(KGT)
並列ボリュームレンダリング、並列大画面システム、並列可視化システムについて、個人的評価も含めて報告。
並列ボリュームレンダリング
- Posix-threadとOpenMPの性能差についての議論あり。
- 可視化のフロントエンドはAVSで行っている。
- 各クラスタが独立しているので理論的には8倍の性能が出るハズだが、実際は出ていない。また、オブジェクトの中身によって性能結果が変わってくるようだ。
- 性能測定グラフは、データ転送/受信時間は含まれていない。単純な表示時間のみの測定値。
- ユーザからの視点では、20分vs2分よりも2秒vs0.2秒の方が利用価値が高いのではないか?
- クラスタへの転送時間を考えると可視化処理の一部を高速化しても、あまり有効になるとは思えない。画像集めるところのボトルネック(イーサネット、IOネック)をどうにか解消しないとならない。
その他
- 立体メガネの紹介があった。当初の販売価格は29,000円を予定。
|
|
[話題2]Pentium-4 クラスタの性能 : 重谷(理研)
- 姫野BMTの問題規模は日産でのサイズ(M)を基準にした。
- コンパイラの性能差が依然として大きい。コンパイラは重要である。
- Myrinetはハード不良が多くSCoreとの組み合わせに原因あり、との説明があったが真因不明。ScoreとMyrinet2000の相性が悪いということではないだろう。不明ではあるが障害が頻発しているというのが実態。光ファイバーのものだと故障がない。現状は、光ファイバーのものだけデリバリしているようだ。
- Beowlfで動いても、Scoreではメモリ不足により動かないときがある。
- アプリケーションによって(値段も含めて)最適なコンパイラがある。
- クラスタのためのインターコネクトは性能を求めるために特別なものを作る努力は報われないのでは。
- Scoreを導入してみてメモリがきつい。しかし予算上、台数とメモリのどちらを取るか検討し、メモリは今後安くなることを見越して台数を選択した。が、富士通のメモリは1年経っても安くならなかった。。
- センター運用を想定して機能不足である。
- 富士通のコンパイラはV2.0では性能良くなかったが、V3.2(プリフェッチ機能が付加ではかなり性能改善された。
- (ご参考)第1回PCクラスタシンポジウム(3月19日、20日)
|
|
[話題3]PCクラスタ環境における高速ファイル共用DAFSご紹介 : 小田(PST)
- DAFSにおける標準化とは何か
→ DAFS Collaborativeの仕様を標準化として採用。
- DAFS Collaborativeのメンバーは?
→ Intel,富士通,日立,NEC,NteApp,Oracleなど。詳細はWebで確認できる。
- 標準化はどこまで?
→ プロトコル(サーバとクライアン間)とDAFS-API
- 先読みしているの?
→ できる
- DAFSサーバを全てのクラスタノードに置く使い方は?
→ 16クライアントでデモを実施し、実証できている。
- Score環境下で動作確認済み。
- Linux上で動作するソフト(クライアント/サーバ)として販売していく。
- ライブラリとしては販売対象外とする。商用販売している会社もあることはある。富士通も要望があれば販売する。
- Windows版については技術的に可能かどうかを検討中である。
- Solaris版のサポート予定は今のところない。
- DAFSユーザレベル実装により、MPI or Scoreの通信を高速化できないか?
→ PSTではユーザレベル実装は商品化の予定がないが、要望があれば相談にのる。
- サーバ側のファイルシステムは?
→ サーバの機能をちゃんとやるため独自である。
- MPIとからめての実装は?
→ PSTではやっていない。
- いつかNFSに置き換わる? あるいはクラスタ内のファイルサーバーになる?
|
|
その他〜問題提起/要望/感想など〜
- 各表示オブジェクトに処理ホストを割り当て、それを合成するというオンデマンドレンダリングサーバは興味深かった。 高エネルギー物理学の計算機利用でも、今まではデータはファイルサーバで持ち、そこから計算サーバへデータを移動して計算するという方式であったが、今後はデータと計算能力をあわせて持つサーバとし、オンデマンドの処理を行うという方法が考えられ始めた。 ユーザが興味のないデータをもつサーバの計算処理能力が無駄になってしまうが。。。
- 実際のアプリケーションによる、いろいろな状況における pentium4の浮動小数点性能がわかって興味深かった。
- PCクラスタをセンター運用するにあたって、ジョブ課金情報(というか使用率情報)は、必要性を感じる良いツールがない。
- MPI/Scoreにおいても、各ノードホストにローカルに接続されている磁気ディスクをシステム全体で有効につかえる並列ファイルシステム、または、グローバルファイルシステム的な仕組みが欲しい。 つまり、高価(と思われる)ファイルサーバシステムより、嫌でも(かつ安価に)ついてくるローカルディスクをシステム全体(ローカルノードのローカルな一時ファイルとして利用できるだけでなく)として使える仕組みが欲しい。
- CAVEのような3次元像の空間に再構成してそれをリアルタイムで動かすようなシステムはどのくらいのクラスタ性能が必要で、そんな研究はどこまで進んでいるのだろうか。
|
|
|