GNU/Linux >> Linux の 問題 >  >> Linux

Slurm JobManagerでノードのCPU/スレッドの使用状況を確認しますか?

Slurmジョブマネージャーを使用するクラスターマシンで作業しています。マルチスレッドコードを開始したばかりで、特定のノードIDのコアとスレッドの使用状況を確認したいと思います。たとえば、

scoreusage -N 92512

「scoreusage」は私にはわからないコマンドです。

承認された回答:

slurmクラスターを実行してから数年が経ちましたが、squeue あなたが望むものをあなたに与えるべきです。試してみてください:

squeue --nodelist 92512 -o "%A %j %C %J"

(これにより、ノード92512でのジョブのジョブID、ジョブ名、CPU、およびスレッドが提供されます)

ところで、特定の1つのノードからの詳細のみが必要な場合を除いて、ノードIDではなくジョブIDで検索する方がよい場合があります。

ウェブ上で利用可能なslurmの使用に関するドキュメントがあり、Googleで簡単に見つけることができる優れたサイトがたくさんあります。HPCクラスターを実行しているほとんどの大学などは、特定のクラスターの詳細に合わせてカスタマイズされた独自のドキュメントとヘルプおよび「チートシート」を作成します。 (s)(したがって、それを考慮に入れて、例をクラスターに適合させてください)。 slurmの使用に関する一般的なドキュメントもあります。 https://slurm.schedmd.com/documentation.html


Linux
  1. コンソールで大きなファイルをチェックする方法

  2. マウントポイントの使用率を取得しますか?

  3. cPanelで帯域幅の使用状況を確認する方法を学ぶ

  1. スレッドが実行されているプロセッサ番号を見つけるにはどうすればよいですか?

  2. Linux で top によって報告される CPU 使用率が 100% を超えるのはなぜですか?

  3. Linux :最後の 1 秒間のプロセスによる CPU 使用率を確認する

  1. Linux スレッド同期に C Mutex ロックの例を使用する方法

  2. CからLinuxでPIDによってプロセスのCPU使用率を計算する方法は?

  3. Linux で特定のプロセスのオープン FD 制限を確認する