プロジェクト

全般

プロフィール

GPU資源管理用プロジェクト

「チケット」でGPUの利用状況を管理します。
https://kanolab.net/redmine/projects/gpu/issues

チケットに開始日時・終了日時を設定すると、
ガントチャート https://kanolab.net/redmine/projects/gpu/issues/gantt
カレンダー https://kanolab.net/redmine/projects/gpu/issues/calendar
にも連動して表示されるようになります。

ThalysおよびFrecciaのGPUを利用開始・終了する際はこちらにも反映させてください。

使い方

  • ガントチャートを見て、空いているGPUを探す。
    • 念のため、実行前に nvtop コマンドなどで、前の実行が終わっているか確認する。
    • freccia > lyria RTX8000 48G > thalys A100 40G > thalys A100 80G の順で、できるだけ必要最小限のリソースを選ぶ。
    • thalys, lyria のGPUは二枚ペアなので、ペアにするときは必ずそのペアを選ぶこと。1枚だけの利用はできるだけ避け、リソースが余る場合はそのように明記する。
  • 利用するGPUを決めたら、対応するチケットを「編集」して更新する。
    • 利用「開始日時」と、「終了日時」(予定)の項目をセット
    • 「ステータス」を「進行中」に変更
    • テキストに
      • 終了見込みの日時(2023/11/6 15時ごろ など)を記載
      • メモリ・計算能力をフルに使わない場合は、その旨記載
    • 「優先度」を各自の締め切りに応じて設定
  • 利用終了したら、対応するチケットを「編集」して更新する。
    • 「ステータス」を「解決」に変更
  • 予定より長引きそうなときは
    • 「終了日時」を修正
    • 「進捗率」を設定

メール通知

Redmineのチケットは、変更があったときにメール通知設定をすることができます。

  • 右上の「個人設定」→「メール通知」
    • ↑の設定によっては、チケットの「ウォッチ」を押す