はじめに
クラウドインフラストラクチャは復元力を提供しますが、すべてのサーバーは物理ハードウェアに依存しており、長期的にはメンテナンスが必要です。 24時間体制のサーバーは、その使用に最適な稼働時間に依存しますが、避けられないダウンタイムが発生します。ハードウェアのメンテナンスとは別に、アップデートとパッチではサーバーを再起動する必要があります。これにより、システムが安全で最新の状態になります。以下のガイドでは、システムがダウンタイムにつながる予期しない再起動を確実に処理するためのベストプラクティスについて説明しています。
手動再起動でスタックをテスト
開発段階で、スタックに重要な変更を加える場合は、サーバーを1回再起動し、スタックが問題なく完全に機能することを確認してください。この再起動トレイルを実行することで、メンテナンスまたはアップグレード中に発生する予期しない再起動に備えることができます。
重要なデータをバックアップする
最も重要で重要なデータのバックアップは、最も重要な手順の1つです。予期しないダウンタイムやその他の偶発的な削除によってデータが失われると、スタックに悪影響を及ぼします。E2EネットワークCDPバックアップは、ファイルシステムの正確なレプリカとして機能します。これは定期的に自動的にバックアップされます。作成された各バックアップには、プロビジョニングから最新のブロック更新まで復元するためにバックアップされたすべてのデータが含まれています。これにより、ポイントインタイムでアーカイブに存在する任意のリカバリポイントから復元できます。詳細については、こちらを参照してください
MySQLまたはMariaDBからデータベースをバックアップし、mysqldumpコマンドを使用してそれらを復元することもできます。 mysqldumpに慣れていない場合は、ここを参照してください
起動時にサービスを有効にする
また、サーバーで構成されているすべての重要で重要なサービスとアプリケーションが起動時に起動できることを確認する必要があります。これにより、将来の再起動時に、手動による介入なしにすべてのサービスが稼働します。
DebianとUbuntuでは、 update-rc.dを使用します スタートアップからサービスを追加または削除するには
sudo update-rc.d service_name defaults
ブートスタートアップからサービスを削除するには、以下のコマンドを使用します
sudo update-rc.d -f service_name remove
Centos7では、systemctlコマンドを使用します
sudo systemctl enable service_name
sudo systemctl disable service_name
ファイアウォールルールが確実に保存されるようにする
ファイアウォールでルールを手動で構成した場合は、ルールがすでに保存されており、起動時に自動的に読み込まれることを確認する必要があります。
以下のコマンドを実行すると、ファイアウォールを永続的に保存できます。
sudo iptables-save > /etc/iptables.firewall.rules
ロードバランサーの使用
システムに完全にダウンタイムを許容できない場合は、ロードバランサーアプライアンスを使用して、ユーザートラフィックを複数のバックエンドノードに動的に分散し、高可用性、スケーラビリティ、フォールトトレランス、スムーズなユーザーエクスペリエンスを実現できます。また、エンドユーザーエクスペリエンスに影響を与えることなく、バックエンドに変更を適用するのにも役立ちます。 E2Eでロードバランサーを起動する方法については、この記事を参照してください