システムリソースとパフォーマンス分析の監視は、システム管理者にとって重要なタスクです。 Linuxでシステムパフォーマンスを監視するために利用できるツールには、top、htop、freeなどがあります。Collectlは、cpu、などのシステムリソースの情報を収集するために使用できる、無料のオープンソースで軽量のパフォーマンス監視ツールです。ディスク、メモリ、ネットワーク、Infiniband、lustre、メモリ、nfs、スラブ、その他多数。他の監視ツールとは異なり、collectlは少数の統計セットに焦点を合わせています。 Collectlは、さまざまなパラメーターを同時に監視し、適切な方法でそれらを報告することができます。 Collectlには、あらゆる種類のシステムパフォーマンスの問題を特定するのに役立つさまざまなオプションが付属しています。 collectlを使用すると、mpstat、netstat、nfsstat、sar、ps、top、iostatの同じ出力を生成できます。
機能
- 出力をさまざまな形式で表示する機能。
- さまざまなファイル形式でデータをエクスポートします。
- リモートマシンを監視するサービスとして実行する機能。
- ほぼすべてのサブシステムを監視します。
このチュートリアルでは、Ubuntu18.04サーバーにCollectlをインストールして使用する方法を学習します。
- Ubuntu18.04を実行しているサーバー。
- サーバーにルートパスワードが設定されています。
開始する前に、システムを最新バージョンに更新する必要があります。これを行うには、次のコマンドを実行します。
apt-get update -y
apt-get upgrade -y
サーバーが更新されたら、サーバーを再起動して変更を適用します。
Collectlをインストール
デフォルトでは、CollectlはUbuntu18.04のデフォルトリポジトリで利用できます。次のコマンドを実行してインストールできます:
apt-get install collectl -y
インストールが完了したら、次のコマンドを実行して、collectlで使用可能なすべてのオプションを一覧表示できます。
collectl --h
次の出力が表示されます。
これは最も一般的なスイッチのサブセットであり、説明領域も省略されています。すべてのタイプ「collectl-x」を表示するには、「collectl」と入力します。usage:collectl [switches] -c、--count countこのサンプル数を収集し、終了します。-f、-filenameディレクトリ/ファイルのファイル名-iに書き込むには、-interval intコレクション間隔(秒単位)[デフォルト=1] -o、-options optionsその他のフォーマットオプション、-showoptions for all d|D-出力Tに日付を含める-出力zに時間を含める-プロットファイルの圧縮をオフにします-p、-'file'からのファイル再生結果を再生します(ワイルドカードの場合は必ず引用してください)。 s、-subsyssubsysは1つ以上のサブシステムを指定します[default=cdn] --verbose出力を詳細形式で表示します(簡単な説明が意味をなさない場合は自動的に選択されます)さまざまな種類のヘルプ-h、-helpこのテキストを印刷します-v、-version印刷バージョン-V、-showdefs印刷操作のデフォルト-x、-helpextend拡張ヘルプ、詳細説明も-X、-helpallはすべてのヘルプを連結して表示します--showoptionsはすべてのオプションを表示します--showsubsysはすべてのサブシステムを表示します--showsuboptsはすべてのサブシステム固有のオプションを表示します--showtopoptsshow--top options--showheader'生成される'ファイルヘッダーを表示します--showcolheaders' '生成されます--SLUBアロケータのshowslabaliases、非ルートエイリアスを表示します--showrootslabsは--showslabaliasesと同じですが、'root'名を使用しますCopyright2003-2016 Hewlett-Packard Development Company、L.P. collectlは、いずれかの条件でのみコピーできますアーティスティックライセンサーまたはGNUGeneralPublic License(ソースキットに含まれている場合があります)
Collectlの操作
ここで、オプションを指定せずにcollectlを実行すると、CPU、ディスク、およびネットワークの統計情報が非常に短く、人間が読める形式で表示されます。
collectl
次の出力が表示されます。
1秒のサンプルを待っています...#<-------- cpu--------><----------ディスク------- ----> <---------- network ----------> #cpu sys inter ctxsw KBRead Reads KBWrit Writes KBIn PktIn KBOut PktOut 17 11503320 4 1 20 3 0 0 0 0 2 1 565165 0 0 0 0 0 2 0 2 6 3 545 83 0 0 0 0 0 2 0 2 0 0 508 39 0 0 0 0 0 2 0 2 1 1 517 42 0 0 0 0 0 2 0 2 1 1 442 37 0 0 0 0 0 2 0 2 1 1 538 65 0 0 20 2 0 2 0 2 1 1 443 39 0 0 0 0 0 2 0 2 1 1 409 39 0 0 0 0 0 2 0 2 1 1 381 38 0 0 0 0 0 2 0 2 1 1 451 44 0 0 0 0 0 2 0 2 3 2 482 42 0 0 0 0 0 2 0 2 9 2528101 0 0 0 0 0 2 0 2 1 1 428 39 0 0 0 0 0 2 0 2
次のコマンドを使用して、すべてのサブシステムの統計を一覧表示することもできます。
collectl --all
出力:
1秒のサンプルを待機しています...#<-------- cpu --------><-------------- ---メモリ-----------------><----------ディスク-----------><--- ------- network ----------> <------- tcp --------> <------ sockets -----> <---- files ---> <------ nfs totals ------ =""> #cpu sys inter ctxsw Cpu0 Free Buff Cach Inac Slab Map Fragments KBRead Reads KBWrit Writes KBIn PktIn KBOut PktOut IP Tcp Udp Icmp Tcp Udp Raw Frag Handle Inodes Reads Writes Meta Comm 3 0 459 48 459 139M 63M 573M 413M 93M 136M jibaa4a59ab 0 0 0 0 0 0 0 0 0 0 0 0 144 0 0 0 1088 44711 0 0 0 0 12 7528142530139M 63M 573M 413M 93M 136M jhbaa5959ab 0 0 0 0 0 2 1 2 0 0 0 0144 0 0 0 1088 44711 0 0 0 0 3 1477 57477139M 63M 573M 413M 93M 136M jhbaa5959ab 0 0 0 0 0 2 0 2 0 0 0 0 144 0 0 0 1088 44711 0 0 0 0 5 2437 55435139M 63M 573M 413M 93M 136M jhbaa5959ab 0 0 0 0 0 2 0 2 0 0 0 0 144 0 0 0 1088 44711 0 0 0 0 1 0 426 43426139M 63M 573M 413M 93M 136M jhbaa5959ab 0 0 0 0 0 2 0 2 0 0 0 0 144 0 0 0 1088 44711 0 0 0 0 4 1435 54435139M 63M 573M 413M 93M 136M jhbaa5959ab 0 0 0 0 0 2 0 2 0 0 0 0 144 0 0 0 1088 44711 0 0 0 0 4 2 471 49472139M 63M 573M 413M 93M 136M jhbaa5959ab 0 0 0 0 0 2 0 2 0 0 0 0 144 0 0 0 1088 44712 0 0 0 0 >
以下に示すように、-topオプションを指定してcollectlコマンドを使用することもできます。
collectl --top
出力:
#時間でソートされたトッププロセス(カウンターは/秒)14:14:24#PIDユーザーPR PPID THRD S VSZ RSS CP SysT UsrT Pct AccuTime RKB WKBMajFMinFコマンド5194ルート2012330 R 66M 27M 0 0.06 0.13 19 00:02.79 0 0 0 0 / usr / bin / perl 8 root 20 2 0 I 0 0 0 0.01 0.00 1 00:01.86 0 0 0 0 rcu_sched 1165 root 20866 0 S 103M 7M 0 0.01 0.00 1 00:05.00 0 0 0 0 sshd:3593ルート20 2 0 I 0 0 0 0.01 0.00 1 00:01.45 0 0 0 0 kworker / 0:01ルート200 0 S 76M 9M 0 0.00 0.00 0 00:10.28 0 0 0 0 / sbin / init 2 root 20 0 0 S 0 0 0 0.00 0.00 0 00:00.02 0 0 0 0 kthreadd 4 root 0 2 0 I 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 kworker / 0:0H 6 root 0 2 0 I 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 mm_percpu_wq 7ルート2020 S 0 0 0 0.00 0.00 0 00:02.75 0 0 0 0 ksoftirqd /09ルート2020 I 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0rcu_bh10ルートRT20 S 0 0 0 0.00 0.00 0 00:00.00 0 000移行/011ルートRT20 S 0 0 0 0.00 0.00 0 00:00.03 0 000ウォッチドッグ/012ルート2020 S 0 0 0 0.00 0.00 0 00: 00.00 0 0 0 0 cpuhp / 0 13 root 20 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 kdevtmpfs 14 root 0 2 0 I 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 netns 15 root 20 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 rcu_tasks_kthre 16 root 20 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 kauditd
CPU、メモリ、およびディスクの使用状況を監視する
-scオプションを指定してcollectlを実行すると、CPU使用率を監視できます。
collectl -sc
出力:
1秒のサンプルを待機しています...#<-------- cpu --------> #cpu sys inter ctxsw 1 1 461 35 2 2 631 71 11 0 472 109 1 1 552 48 1 1 457 39 0 0 566 46 5 3 572101 0 0 543 38 1 1 445 40 1 1 591 43 1 1 441 36 0 0 565 51
次のコマンドを使用して、CPU使用率の詳細情報を確認することもできます。
collectl -sC
出力:
1秒のサンプルを待機しています...#SINGLE CPU STATISTICS#Cpu User Nice Sys Wait IRQ Soft Steal Guest NiceG Idle 0 2 0 3 0 0 0 0 0 0 94 0 0 0 1 0 0 0 0 0 0 98 0 0 0 1 0 0 0 0 0 0 98 0 0 0 0 0 0 1 0 0 0 98 0 0 0 0 0 0 0 0 0 0100 0 0 0 0 0 0 0 0 0 0100 0 1 0 1 0 0 0 0 0 0 97 0 0 0 0 0 0 0 0 0 0100 0 0 0 1 1 0 1 0 0 0 96 0 0 0 0 0 0 0 0 0 0100 0 0 0 1 0 0 0 0 0 0 98
システムのメモリ使用量を監視するには、次のコマンドを実行します。
collectl -sm
出力:
1秒のサンプルを待っています...#<----------- memory ----------->#Free Buff Cach Inac Slab Map 139M 63M 573M 413M 93M 136M 139M 63M 573M 413M 93M 136M 139M 63M 573M 413M 93M 136M 139M 63M 573M 413M 93M 136M 139M 63M 573M 413M 93M 136M 139M 63M 573M 413M 93M 136M 139M 63M 573M 413M 93M 136M pre>次のコマンドを使用して、詳細情報を使用してメモリ使用量を監視します。
collectl -sM出力:
1秒のサンプルを待機しています...#MEMORY STATISTICS#ノード合計使用済みフリースラブマップAnon AnonH Locked Inact HitPct 0 985M 866844K 142800K 95928K 46160K 93416K 0 5408K 423952K 100.00 0 985M 866844K 142800K 95928K 46160K 93416K 0 5408K 423952 866844K 142800K 95928K 46160K 93416K 0 5408K 423952K 100.00 0 985M 866844K 142800K 95928K 46160K 93416K 0 5408K 423952K 100.00 0 985M 866844K 142800K 95928K 46160K 93416K 0 5408K 423952K 100.00 0 985M 866844K 142800K 0 5408K 423952K 100.00 0 985M 866844K 142800 5408K 423952K 100.00次のコマンドを使用して、ディスクの使用状況を監視できます。
collectl -sd出力:
1秒のサンプルを待機しています...#<---------- disks ----------->#KBRead Reads KBWrit Writes 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 8 0 0 0 0 2次のコマンドを使用して、詳細情報を使用してディスク使用量を監視します。
collectl -sD出力:
1秒のサンプルを待機しています...#DISK STATISTICS(/ sec)#<---------読み取り---------------> <--- ------writes --------------> <-------- averages --------> Pct#Name KBytes Merged IOs Size Wait KBytesマージされたIOサイズ待機RWSizeQLen待機SvcTimUtilsda0 0 0 0 0 0 0 0 0 0 0 0 0 0 0sda 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0sda 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0sda 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0sda 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0sda 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0sda 0 0 0 0 0 20 1 1 20 0 20 0 0 0 0sda 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0CPU、メモリ、ディスクを一度に監視
次の1つのコマンドを実行することで、CPU、メモリ、およびディスクの使用状況を監視できます。
collectl -scmd出力:
1秒のサンプルを待機しています...#<-------- cpu --------> <----------- memory ------ -----> <---------- disks -----------> #cpu sys inter ctxsw Free Buff Cach Inac Slab Map KBRead Reads KBWrit Writes 1 0 518 43 140M 63M 573M 413M 93M 135M 0 0 0 0 7 2509104140M 63M 573M 413M 93M 135M 0 0 20 1 3 1518 52140M 63M 573M 413M 93M 135M 0 0 0 0 1 1445 43140M 63M 573M 413M 93M 135M 0 0 0 0 2 1 482 51140M 63M 573M 413M 93M 135M 0 0 0 0 1 1535 56140M 63M 573M 413M 93M 135M 0 0 0 0 3 1499 48140M 63M 573M 413M 93M 135M 0 0 0 0 2 1482 53140M 63M 573M 413M 93M 135M 0 0 20 2結論 上記の記事では、collectlの概要を簡単に説明しました。 Collectlには、Linuxシステムの監視を容易にする多くのオプションが付属しています。
Ubuntu