(6/8)4. 自動運転スケジューラ
4.1. 基本概念と機能
本センターでは、これまでシステム運転サービスのためにスケジューラを独自開発する一方でNQS-JM,NQS-JSを使って、利用者ジョブの管理、ジョブのスケジューリングを行ってきた。
しかし、このようなシステムでは、つぎのような問題がある。
したがって、これらの問題に対処するために、自動運転スケジューラの実現を検討している。
- 定期保守など計画的なシステム停止の場合、指定時間までに確実にジョブ処理を終えるような枠組みが無く、人手に頼っており、最悪、強制停止、ジョブのリスタートが発生している。
- また、システムが混んでくると40PEを必要とする高並列ジョブ(キューh)のターンアラウンドの保障が困難である。これも人手でJob_Class_List、Run_Limitを調整している。
この自動運転スケジューラの基本的な機能としては、つぎのものである。
- 運転スケジュール管理機能
システムサービスのスケジュールを管理して、システム定期保守(毎週火曜日17:00)や空調設備の定期点検(隔月第3日曜8:30)時には、全てのジョブ処理を停止して、システムを停止する。- ジョブリクエストの管理機能
投入されたジョブが要求しているシステム資源を把握して、システム停止時間までに終了しないと予測されるジョブはスケジュールされないようにホールドする。
また、状況を判断してジョブをリリースする。
- システムの動的構成変更機能
システム運転スケジュールおよび実行待ち、実行中ジョブの状況をもとに、Job_Class_List、Run_Limit,NQS-JSのパラメータなど動的に変更する。