Slurmジョブマネージャーを使用するクラスターマシンで作業しています。マルチスレッドコードを開始したばかりで、特定のノードIDのコアとスレッドの使用状況を確認したいと思います。たとえば、
scoreusage -N 92512
「scoreusage」は私にはわからないコマンドです。
承認された回答:
slurmクラスターを実行してから数年が経ちましたが、squeue
あなたが望むものをあなたに与えるべきです。試してみてください:
squeue --nodelist 92512 -o "%A %j %C %J"
(これにより、ノード92512でのジョブのジョブID、ジョブ名、CPU、およびスレッドが提供されます)
ところで、特定の1つのノードからの詳細のみが必要な場合を除いて、ノードIDではなくジョブIDで検索する方がよい場合があります。
ウェブ上で利用可能なslurmの使用に関するドキュメントがあり、Googleで簡単に見つけることができる優れたサイトがたくさんあります。HPCクラスターを実行しているほとんどの大学などは、特定のクラスターの詳細に合わせてカスタマイズされた独自のドキュメントとヘルプおよび「チートシート」を作成します。 (s)(したがって、それを考慮に入れて、例をクラスターに適合させてください)。 slurm
の使用に関する一般的なドキュメントもあります。 https://slurm.schedmd.com/documentation.html