|
1.日 時 : 平成10年11月19日(木)午前10時50分〜午後12時40分
| |
|
2.場 所 : 神戸ベイシェラトン ホテル&タワーズ
[所在地]〒658-0032 兵庫県神戸市東灘区向洋町中2丁目13番地
[電 話] 078−857−7000(代表)
| |
|
3.企画委員: 佐藤一雄(核燃料サイクル開発機構) | |
|
福田正大(航空宇宙技術研究所) | |
|
渡部善隆(九州大学大型計算機センター) | |
|
石川 正(高エネルギー加速器研究機構計算科学センター)
| |
|
畑佳一朗(富士通 シス本・科学シス統・R&Dシステム部)
| |
|
大空 瞭(富士通 ソ事本・HPCソフト統)
| |
|
野村一成(富士通 シス本・第三シス事・第一文教システム部)
|
|
|
畠間晴夫(富士通 シス本・科学シス統・R&Dソリューション部) | |
|
4.検討内容: (敬称略)
| |
|
−司会− 福田企画委員
| |
|
(1)開催趣旨 佐藤企画委員 【10:50〜10:55】
| |
|
(2)九州大学大型計算機センターにおけるジョブスケジューリングの改善に向けて
【10:55〜11:25】
| |
|
九州大学大型計算機センター |
|
|
池田 大輔, 南里 豪志, 荒木 元, 天野 浩文
| |
|
|
大型計算機センターのシステム運用において, スーパーコンピュータ
のジョブスケジューリングは重要である. 特に近年, 並列計算機の導入
によるシステムの複雑化や, 定額利用制度によるジョブの増加により,
ほとんどの大型計算機センターで効率の良いスケジューリング技術が求
められている. しかし, 従来ベンダーから提供されていたシステムのみ
では, FIFO(First In First Out)方式でしかジョブを実行することがで
きなかった. これに対し, 富士通から提供されたNQS-JSは, キューに格
納されているジョブについて, 使用する資源量と現在の空き資源を基に
して計算したジョブ毎の優先度を用いてスケジューリングを行なう. こ
のように, ジョブの実行を開始させる順序を変更することにより, シス
テムの運用効率向上が期待できる.
本稿では, このようなジョブの順序変更による運用効率の変化をシミ
ュレーションによって評価する. さらに,NQS-JS を大型計算機センター
のスーパーコンピュータで利用する場合の,
・大型計算機センターの計算機に実際に投入されるジョブは多種多様
で, キューに格納されているジョブと現在の空き資源についての情
報からだけでは効率よいスケジューリングを行えない.
・互いに全く無関係なユーザー同士が資源を取り合うことが頻繁に起
るため, 均等に各ユーザーに資源を割り当てる必要がある.
というような問題点について指摘し, 改善策を提案する.
| |
|
|
|
(3) 数値風洞ジョブスケジューラについて 【11:25〜11:55】
| |
|
航空宇宙技術研究所 計算科学研究部
末松和代 土屋雅子 三向ソフトウエェア開発(株) エンジニアリングシステム開発部 藤岡 晃 |
|
|
|
並列大型計算機の運用では、計算機の稼働率の向上を図ると共に、ジ
ョブの妥当な実行待ち時間を保証する必要があるが、それにはジョブの
適切なプライオリティ管理と、実行ジョブの選択アルゴリズムが重要で
ある。また、実際の運用においては、運用方針・計画に合わせて柔軟に
運用条件を設定できることも必要となる。これらの要求から航空宇宙技
術研究所では、NQSの拡張関数を利用した独自のジョブスケジューラの開
発を行った。並列大型計算機の効率的運用の為の1つのアプローチとし
て紹介する。
| |
|
|
|
(4)R&D分野の運用管理について 【11:55〜12:25】
| |
|
富士通愛知エンジニアリング
開発統括部第1開発部 長崎孝紀 |
|
|
富士通 ソフトウェア事本部
HPCソフトウェア統括部第1開発部
長田和久
| |
|
|
- VPPにおけるジョブスケジューリング
VPPシリーズにおけるベクトル並列計算の実行環境として、オープ
ン系のde−facto標準であるネットワークキューイングシステム
(NQS)をエンハンスして提供している。しかし、計算機の資源活用、
ユーザに公平なスケジューリング、といった点で、NQSのFIFOス
ケジューリングには課題があった。今回は、この課題解決策として、リ
ソースベースのスケジューリングを行うことにより、並列計算機のスル
ープット向上を図るNQS−JS、および、ユーザごとのジョブ数を制
御して公平なスケジューリングを行うNQS−JMについて報告する。
- VPPにおける運用管理
PCやWSの普及に伴い、計算サーバ(VPPシステム)の運用監視
や操作を計算サーバ自体からオフロードする仕組みが整いつつある。ま
た、計算サーバの高い計算能力への影響を極力及ぼさず、運用管理(課
金管理、利用者登録、性能監視、ジョブ監視、等)を行なうことがます
ます重要になってきている。今回は、WebGUIやPC操作を利用し、
複数の計算サーバを管理対象とした運用管理製品群について報告する。
| |
|
|
|
(5) 総合ディスカッション 【12:25〜12:35】
| |
|
(6) まとめ 佐藤企画委員 【12:35〜12:40】
| |