HPC環境統合運用ミドルウェア ShareTask
マルチベンダー,クラウドの浸透により複雑さを増すHPCシステムの運用課題を解決にするためにShareTaskは開発されました.
ShareTaskは,監視・制御・スケジューリングの各種機能をWebアプリケーションとして独自に実現しています.その有機的に統合された機能群は,複雑なシステムの運用をシンプルにし,ハードウェアとソフトウェアライセンスの利用効率を向上させ,計算業務のスピードアップに貢献します.
監視・制御・スケジューリングの各機能がWeb+DBを中心に有機的に結合されています
充実の機能
ジョブスケジューラ
- 独自スケジューラを内蔵
サードパーティー製品不要
- メタスケジューリング
-
- PBS, Torque, LSF, OpenLava, SLURMへのジョブ投入から結果回収までを自動化
- 既存システムとの共存と融合を実現
マシン監視
-
CPU,メモリ,ストレージ使用履歴を可視化
-
syslogメッセージDB化して閲覧分析
- アラートメール送信
マシン制御
- 障害発生マシンの自動的分離
- ジョブキューに連動した電源ON/OFF(省電力化)
-
- ジョブがないときは計算ノードを自動的にシャットダウンし,ジョブが増えてくると必要なノードだけを自動起動する
Webユーザーインターフェース
- ジョブ投入,監視,制御をブラウザでPCからのファイルアップロード/ダウンロード
- コマンドラインもサポート
-
PBSコマンドエミュレーション(ジョブスクリプト資産を継承できる)
DB化された稼働履歴・集計
- ジョブ,マシン,アプリライセンスの詳細な使用履歴をDBに記録
-
Web画面で集計を閲覧・分析(テーブル,グラフ)
-
Excel形式ダウンロード(ユーザー独自の分析が容易)
クラウド対応
-
サポート: Amazon EC2,Microsoft Azure,FOCUS
-
ファイル・ジョブ転送を自動化(クラウドマシンの直接操作が不要)
-
オンプレミス-クラウドの統合運用
革新的なアーキテクチャ
- 計算ノードを自律的に制御するエージェントによる分散制御
-
- 高い耐障害性
- 運用を止めずに計算ノードを追加・削除できる
- 中央サーバー・エージェント間の通信はHTTP
-
- インターネット,イントラネットへの高い適応性
- 中央サーバーは冗長構成が可能
画期的なライセンス方式
- 同時実行ジョブ数によるライセンス
-
- ライセンス数を超えるジョブは待ち行列(キュー)上で待機します
- キューには上限なくジョブを投入できます
-
CPUコア数には依存しません
-
- メニーコアと高並列のトレンドにマッチした方式です