数週間前、私は「Red HatEnterpriseLinuxPresents…」ライブストリームで由緒あるKenHessと話をしました。議論のトピックは一般的なシステム管理慣行であり、ケンと私はそれが何であるかについて非常に異なる意見を持っていることが明らかになりました。
ケンと私はどちらも、システム管理のギルディドエイジとしか言いようのない仕事をしていました。今回は、管理者は自分が管理するシステムを愛情を込めて手作りしていました。文字通りギルドがありましたが、それは今日でも存在しています:システム管理者ギルド。また、この期間中、多くのシステムは信じられないほど高価でした。その結果、管理者は多くの場合5〜20台のサーバーを管理していました。その要因の1つは、Unixスペースのコンピューティングハードウェアが非常に高価だったことです。下の写真にある私のSiliconGraphicsIndyワークステーションは、新品のときは約26,000ドルでした。
この時代には、効果的な管理者になるためにさまざまなスキルが必要であり、次のようなタスクに多くの時間を費やしました。
ストレージ計画 :大容量ディスクドライブは1Gであり、ファイルシステムはサイズ変更などの機能をサポートしていませんでした。システムをインストールしてストレージ構成をセットアップするとき、さまざまなファイルシステム用に選択されたサイズとディスク上のそれらの配置は、マシンの寿命を確保するために重要でした。選択が不十分な場合は、数か月後にすべてをやり直して、バックアップからコンテンツを復元することになります。
ソフトウェア管理 :ソフトウェアのパッケージ化はほとんどありませんでした。通常、ソースアーカイブをダウンロードしてコンパイルし、マシンにインストールしていました。ただし、そのソフトウェアはパッケージ化されていないため、管理者はそれを保守する必要があります。これは、ダウンロードしたプロジェクト(Apacheなど)を監視して、更新が発行されるかどうかを確認することで構成されていました。それらができたら、更新されたバージョンをダウンロードし、再度コンパイルして、インストールすることができました。なんて楽しいでしょう?
カーネルの再コンパイル :運が良ければ、テープライブラリ、スキャナー、光ストレージなどの追加のデバイスがマシンに必要な場合、システムのカーネルにそのドライバーがあります。しかし、多くの場合、そうではありませんでした。つまり、カーネルを再コンパイルしてドライバーを追加するか、運が良ければカーネルのドライバーモジュールを作成する必要がありました。仕事で1日を過ごすのになんて素晴らしい方法でしょう!
個々のプロセスの管理 :これらのシステムは、多くの場合、使い捨てではありませんでした。多くの場合、システムは一部の情報のWebサーバーとして機能しますが、データ分析ジョブまたはレンダリングを実行し、メールサーバーとして実行し、組織にDNSサービスを提供し、ファイルサーバーとして機能します。システムは非常に多くのことを実行したため、暴走したバインドプロセスまたはApacheデーモンが組織に大きな影響を与える可能性があります。つまり、システムをチェックし、プロセスを頻繁に調べてこれらの問題を早期に発見するか、cron
で実行する独自のスクリプトを作成していました。 潜在的な問題を通知するジョブ。今日私たちが依存しているほとんどのものとは異なり、包括的な監視アプリケーションはありませんでした。それらは自分で書かなければなりませんでした。
ユーザーの管理 :システムは多機能であるため、さまざまなことを行う複数の人によっても使用されていました。つまり、さまざまな人々がさまざまなシステムにアクセスする必要がありました。したがって、システム群全体で個々のアカウントも管理しました。 NISのようないくつかの中央ユーザーサービスがありましたが、現時点では、特定のユーザーがアクセスを許可されているシステムを適切に制御することはできませんでした。つまり、ユーザーが中央ユーザーサービスを使用している場合、ユーザーは組織内の任意のシステムにアクセスできます。それよりもオープンでない場所で作業した場合は、useradd
を使用して時間を費やす必要があります およびuserdel
誰がどのシステムにアクセスできるかを維持するため。
[読者も楽しんだ:システム管理者としてのキャリア:システム管理者の仕事はなくなりますか? ]
明らかに、今日、中央のユーザー管理および監視サービスからパッケージ形式、より優れたソフトウェアおよびハードウェアエコシステムまで、これらのタスクを廃止した多くのテクノロジーがあります。それはまた、私たちがさまざまなタスクを実行するために仕事に時間を費やしていることを意味します。何年にもわたってテクノロジーリソースにこれらすべての改善があったということは、今でははるかに多くのシステムを管理していることを意味します。以前はGildedAgeでしたが、現在はシステム管理の工業化時代です。システムとクラウドのような展開モデルの人口が多いということは、私たちが昔は不可能だったスピードと効率で運用していることを意味します。
今日、私は、管理者がより効率的にまたはより大規模にタスクを実行できるようにするスキルがより重要であることを提案します。次のようなスキル:
標準化 :以前、私は複数の目的を持つシステムについて話しました。ただし、特定の目的専用のシステムがあるということは、それらすべてを一緒に管理できることを意味します。更新が必要な場合は、おそらく全員がその更新を必要とします。新しい構成設定を取得する場合は、おそらくすべての構成設定が必要です。
自動化 :自動化も標準化にとって重要です。すべてのWebサーバーにnginx更新を適用する必要があることに気付いた場合は、実際にそれを行う方法が必要です。独自のツールやスクリプトを使用する場合でも、Ansibleのようなフレームワークを使用する場合でも、システム全体でタスクを実行するには、効率的で反復可能な方法が必要です。
監視 :管理するシステムの数が多いと、おそらくすべてをチェックすることはできません。監視方法を使用すると、問題を早期に特定できます。監視は、標準化および自動化と組み合わせると、カスケード障害であった可能性のあるものを早期に発見して解決することができます。たとえば、Webサーバーの1つがそのファイルシステムの1つでディスク容量が少ない場合、そのタイプのシステムの多くはおそらく同様の状態にあります(ただし、監視アラートのしきい値をまだ超えていない可能性があります)。自動化ユーティリティを使用してファイルシステムの問題に対処し、それを母集団に適用して、近い将来の問題の発生を防ぐことができます。
レポート :これらのより大きな人口を取得すると、それらすべてを個別に見ることはできません。あなたは彼らから彼らの構成、インストールされたパッケージ、および他の機能に関するデータを収集する必要があります。繰り返しになりますが、自動化と標準化を組み合わせると、これは強力なツールになります。更新を必要とする人口の広大な範囲に更新を適用するなどのことができるからです。同様に重要なのは、その人口に何が含まれているかを知ることです。最近、私たちの環境で特定のベンダーのソフトウェアを使用しているかどうか尋ねられました。展開されているものに関するデータを定期的に収集しているため、展開されていないことを自信を持って報告することができました。さらに、システムが最後のメンテナンスを行った時期や、そのメンテナンスの詳細などに関する追加データを提供しました。必要に応じて、人口レベルから個々のボックスまで、システムで実行されたアクションの履歴を提供できます。
[HBR Analytic Servicesからの新しい調査-IT人材戦略:新しい時代の新しい戦術]
まとめ
数え切れないほどの業界が個々の小規模な実務家からより大規模な工業化されたプロセスに移行するにつれて、システム管理者は適応する必要があります。記事のタイトルが示すように、ギルディドエイジのシステム管理は死んでおり、産業時代の長生きするシステム管理です!