平成10年度科学技術計算分科会 第1回会合スケジュール


テーマ:VPPにおける運用管理とその方法


     1.日 時 : 平成10年11月19日(木)午前10時50分〜午後12時40分

2.場 所 : 神戸ベイシェラトン ホテル&タワーズ
      [所在地]〒658-0032 兵庫県神戸市東灘区向洋町中2丁目13番地
      [電 話] 078−857−7000(代表)

3.企画委員: 佐藤一雄(核燃料サイクル開発機構)
       福田正大(航空宇宙技術研究所)
       渡部善隆(九州大学大型計算機センター)
       石川 正(高エネルギー加速器研究機構計算科学センター)
       畑佳一朗(富士通 シス本・科学シス統・R&Dシステム部)
       大空 瞭(富士通 ソ事本・HPCソフト統)
       野村一成(富士通 シス本・第三シス事・第一文教システム部)
       畠間晴夫(富士通 シス本・科学シス統・R&Dソリューション部)
 
4.検討内容: (敬称略)

              −司会−             福田企画委員


 (1)開催趣旨           佐藤企画委員     【10:50〜10:55】

 

 (2)九州大学大型計算機センターにおけるジョブスケジューリングの改善に向けて
                            【10:55〜11:25】
                  九州大学大型計算機センター
                  池田 大輔, 南里 豪志, 荒木 元, 天野 浩文
      大型計算機センターのシステム運用において, スーパーコンピュータ
のジョブスケジューリングは重要である. 特に近年, 並列計算機の導入
によるシステムの複雑化や, 定額利用制度によるジョブの増加により,
ほとんどの大型計算機センターで効率の良いスケジューリング技術が求
められている. しかし, 従来ベンダーから提供されていたシステムのみ
では, FIFO(First In First Out)方式でしかジョブを実行することがで
きなかった. これに対し, 富士通から提供されたNQS-JSは, キューに格
納されているジョブについて, 使用する資源量と現在の空き資源を基に
して計算したジョブ毎の優先度を用いてスケジューリングを行なう. こ
のように, ジョブの実行を開始させる順序を変更することにより, シス
テムの運用効率向上が期待できる.
 本稿では, このようなジョブの順序変更による運用効率の変化をシミ
ュレーションによって評価する. さらに,NQS-JS を大型計算機センター
のスーパーコンピュータで利用する場合の,
 ・大型計算機センターの計算機に実際に投入されるジョブは多種多様
  で, キューに格納されているジョブと現在の空き資源についての情
  報からだけでは効率よいスケジューリングを行えない.
 ・互いに全く無関係なユーザー同士が資源を取り合うことが頻繁に起
  るため, 均等に各ユーザーに資源を割り当てる必要がある.
というような問題点について指摘し, 改善策を提案する.

 

 


 (3) 数値風洞ジョブスケジューラについて        【11:25〜11:55】
                  航空宇宙技術研究所 計算科学研究部
                                  末松和代
                                  土屋雅子
                  三向ソフトウエェア開発(株)
                  エンジニアリングシステム開発部 藤岡 晃
      並列大型計算機の運用では、計算機の稼働率の向上を図ると共に、ジ
ョブの妥当な実行待ち時間を保証する必要があるが、それにはジョブの
適切なプライオリティ管理と、実行ジョブの選択アルゴリズムが重要で
ある。また、実際の運用においては、運用方針・計画に合わせて柔軟に
運用条件を設定できることも必要となる。これらの要求から航空宇宙技
術研究所では、NQSの拡張関数を利用した独自のジョブスケジューラの開
発を行った。並列大型計算機の効率的運用の為の1つのアプローチとし
て紹介する。
 
 




 (4)R&D分野の運用管理について            【11:55〜12:25】
                  富士通愛知エンジニアリング
                      開発統括部第1開発部 長崎孝紀
                  富士通 ソフトウェア事本部
                  HPCソフトウェア統括部第1開発部
                                 長田和久
     - VPPにおけるジョブスケジューリング
 VPPシリーズにおけるベクトル並列計算の実行環境として、オープ
ン系のde−facto標準であるネットワークキューイングシステム
(NQS)をエンハンスして提供している。しかし、計算機の資源活用、
ユーザに公平なスケジューリング、といった点で、NQSのFIFOス
ケジューリングには課題があった。今回は、この課題解決策として、リ
ソースベースのスケジューリングを行うことにより、並列計算機のスル
ープット向上を図るNQS−JS、および、ユーザごとのジョブ数を制
御して公平なスケジューリングを行うNQS−JMについて報告する。

- VPPにおける運用管理
 PCやWSの普及に伴い、計算サーバ(VPPシステム)の運用監視
や操作を計算サーバ自体からオフロードする仕組みが整いつつある。ま
た、計算サーバの高い計算能力への影響を極力及ぼさず、運用管理(課
金管理、利用者登録、性能監視、ジョブ監視、等)を行なうことがます
ます重要になってきている。今回は、WebGUIやPC操作を利用し、
複数の計算サーバを管理対象とした運用管理製品群について報告する。

 




 (5) 総合ディスカッション               【12:25〜12:35】

 

 (6) まとめ              佐藤企画委員  【12:35〜12:40】

 




[合同分科会/HPCミーティング開催案内][SS研ホームページ]

Email:ssken@ssken.cab.infoweb.ne.jp