GPU資源管理用プロジェクト¶
「チケット」でGPUの利用状況を管理します。
https://kanolab.net/redmine/projects/gpu/issues
チケットに開始日時・終了日時を設定すると、
ガントチャート https://kanolab.net/redmine/projects/gpu/issues/gantt
カレンダー https://kanolab.net/redmine/projects/gpu/issues/calendar
にも連動して表示されるようになります。
ThalysおよびFrecciaのGPUを利用開始・終了する際はこちらにも反映させてください。
使い方¶
- ガントチャートを見て、空いているGPUを探す。
- 念のため、実行前に nvtop コマンドなどで、前の実行が終わっているか確認する。
- freccia > lyria RTX8000 48G > thalys A100 40G > thalys A100 80G の順で、できるだけ必要最小限のリソースを選ぶ。
- thalys, lyria のGPUは二枚ペアなので、ペアにするときは必ずそのペアを選ぶこと。1枚だけの利用はできるだけ避け、リソースが余る場合はそのように明記する。
- 利用するGPUを決めたら、対応するチケットを「編集」して更新する。
- 利用「開始日時」と、「終了日時」(予定)の項目をセット
- 「ステータス」を「進行中」に変更
- テキストに
- 終了見込みの日時(2023/11/6 15時ごろ など)を記載
- メモリ・計算能力をフルに使わない場合は、その旨記載
- 「優先度」を各自の締め切りに応じて設定
- 利用終了したら、対応するチケットを「編集」して更新する。
- 「ステータス」を「解決」に変更
- 予定より長引きそうなときは
- 「終了日時」を修正
- 「進捗率」を設定
メール通知¶
Redmineのチケットは、変更があったときにメール通知設定をすることができます。
- 右上の「個人設定」→「メール通知」
- ↑の設定によっては、チケットの「ウォッチ」を押す