[目次] [次ページ] [質疑応答]

九州大学大型計算機センターにおけるジョブスケジューリングの改善に向けて

  1. はじめに
  2. 現システムにおけるジョブスケジューリング
  3. 現システムの問題点と我々のアプローチ
  4. シミュレーション
  5. おわりに
  6. [参考資料]
  7. 講演OHP
九州大学大型計算機センター 研究開発部
池田 大輔(写真), 南里 豪志
{daisuke, nanri}@cc.kyushu-u.ac.jp
九州大学システム情報科学研究科
荒木 元
九州大学大型計算機センター 研究開発部
天野 浩文
amano@cc.kyushu-u.ac.jp



(1/24)
1.はじめに

 近年、ベクトル化や並列化等の技術により、計算機の処理性能は飛躍的に向上した。しかし、計算機よって処理されるべき問題のサイズは、計算機の処理性能の延びを遥かに上回る勢いで増大している。そのため、大型計算機センターの計算機のように、多数のユーザーに提供されている計算機では、多数の処理が集中して計算資源を取り合っている状態にあり、効率よく計算機資源を割り当てるスケジューリング技術が求められている。しかし、従来ベンダーから提供されていたシステムのみでは、FIFO(First In First Out)方式でしか計算機資源を割り当てることができなかった。この方法では、割り当てる順序を変えることができないため、特に並列計算機のように要求を多重処理できるシステムでは、資源待ちによる稼働率の低下が大きな問題となる。
 そこで本稿では、本センターに導入された並列計算機におけるスケジューリング技術について検討する。大学の研究室や企業の研究所等と比較した本センターにおける計算機の運用上の特徴として、投入されるジョブが多種多様で負荷の予想が出来ないことと、互いに全く無関係なユーザー同士が資源を取り合うことが頻繁に起るということが挙げられる。 そのため、現在のシステムで動作するスケジューラが行っているような、キューに格納されているジョブと現在の空き資源についての情報を用いたスケジューリングだけでは、効率よく、各ユーザーに均等に資源を割り当てることができない。これに対し本稿で提案する方法は、スケジューラの外部に管理プログラムを構築するものである。これにより、現在動作しているジョブについて、残りの実行時間や、投入したユーザーなどの情報を取得し、より効率の良いスケジューリングを行うことができる。


[目次] [次ページ] [質疑応答]