GNU/Linux >> Linux の 問題 >  >> Linux

分散データベースとは何ですか?分散データシステムは何のためにありますか?

分散データベースには、集中データベースに比べていくつかの重要な利点があります。多くの企業は、さまざまな理由で分散データベース(データベースは、その名前が示すように、さまざまな場所にあるサーバーのアレイ全体に分散されています)に切り替えています。分散データベースの基本的な利点のいくつか、それらが使用される典型的なシナリオ、およびデータが分散データシステム全体に分散されるさまざまな形式を見てみましょう。

分散データベースがますます普及している理由

多くの組織がデータベース分散を支持して集中型モデルを残している基本的な理由は次のとおりです。

  1. 信頼性 –インフラストラクチャの構築は投資に似ています。損失の可能性を減らすために分散します。具体的には、1つの配布領域で障害が発生した場合でも、データベース全体で障害が発生することはありません。
  2. セキュリティ –データベース全体の単一のセクションに権限を付与して、内部および外部の保護を強化できます。
  3. 費用対効果 –ユーザーがリモートデータにアクセスする頻度が少ないため、帯域幅の価格が下がります。
  4. ローカルアクセス –上記の#1と同様に、アンブレラネットワークに障害が発生した場合でも、データベースの自分の部分にアクセスできます。
  5. 成長 –ビジネスに新しい場所を追加する場合、データベース内にノードを追加するのは簡単で、配布を非常にスケーラブルにします。
  6. 速度とリソースの効率 –ほとんどのリクエストやデータベースとのその他の双方向性はローカルで実行されるため、リモートトラフィックが減少します。
  7. 責任と封じ込め –グリッチまたは障害はローカルで発生するため、問題は含まれています。会社のその部分を処理するように指定されたITスタッフが処理できる可能性があります。

分散データベースを使用しているのは誰ですか?

多くの場合、分散データベースは、地理的に異なる場所に多数のオフィスや店舗がある組織で使用されます。通常、個々の支店は主に自社の業務に関連するデータとやり取りしており、一般的な企業データの必要性ははるかに低くなっています。
この場合、支店からの中央情報に対する一貫性のないニーズがあります。ただし、会社のホームオフィスには、すべての場所からの情報の安定した流入が必要です。
この問題を解決するために、分散データベースは通常、各会社の場所が勤務時間中に独自のデータベースと直接対話できるようにすることで機能します。ピーク時以外の毎日、データベース全体が各ブランチからデータのバッチを受け取ります。

分散データの種類

複製されたデータ –データのレプリケーションは、データベースのさまざまな部分にデータの追加インスタンスを作成するために使用されます。この戦術を使用すると、同じデータにローカルでアクセスできるため、分散データベースは過剰なトラフィックを回避できます。分散データは、以下に概説するように、5つの基本的なタイプに分けることができます。

この形式のデータは、読み取り専用データと書き込み可能データの2つの異なるタイプに細分されます。書き込み可能なバージョンを調整できます。これにより、システム全体のすべてのレプリケーションで更新が実行される方法とタイミングに関するさまざまな構成を使用して、最初のインスタンスがすぐに変更されます。読み取り専用バージョンでは、最初のインスタンスのリビジョンも許可され、それに応じてレプリケーションが調整されます。

この分散データシステムでは、データベースが刻々と(または任意の期間にわたって)正しい詳細を持っていることがどれほど重要であるかに基づいて、更新を構成できます。レプリケーションは、分散データシステム全体にリアルタイムで表示されるリビジョンを必要としない場合に特に価値があることに注意してください。

このタイプのデータを使用すると、大規模なデータベースの任意のセクションから他のセクションにデータを簡単に提供できます。後者のセクションのデータがエラーによって危険にさらされた場合です。ただし、レプリケーションでは、衝突に注意してください。 発生する可能性があります。それらを防止/解決するための安全対策を講じる必要があります。

水平方向に断片化されたデータ –このカテゴリーのデータ配布には、主キーの使用が含まれます(各キーはデータベース内の1つのレコードを参照します)。水平方向の断片化は、通常、特定の事業所が特定の支店のデータベースにのみアクセスする必要がある状況で使用されます。

垂直方向に断片化されたデータ –垂直方向の断片化では、主キーが再び使用されます。ただし、この場合、主キーのコピーはデータベースの各セクション内で使用できます(各ブランチにアクセスできます)。このタイプの形式は、事業の支店と中央の場所が同じアカウントと相互作用するが、おそらく異なる方法(クライアントの連絡先情報の変更と財務数値の変更など)で相互作用する状況でうまく機能します。

再編成されたデータ –再編成とは、意思決定支援データベースで一般的なように、データが何らかの方法で調整されたことを意味します。場合によっては、トランザクションと意思決定支援を処理する2つの異なるシステムがあります。意思決定支援システムは技術的に維持するのが難しい場合がありますが、オンライントランザクション処理(OLTP)では、大量の要求を可能にするために再構成が必要になることがよくあります。

個別スキーマデータ –このカテゴリは、データベースとそれにアクセスするために使用されるソフトウェアを分割して、さまざまな部門や状況に適合させます。たとえば、ユーザーデータと製品データです。通常、このタイプのディストリビューション内のさまざまなデータベース間には重複があります。

分散データベースの種類とセキュリティの詳細については、こちらのブログ投稿をご覧ください。 Atlantic.Netは、ハウツーガイド、記事、FAQを含むリソースページを通じて、テクノロジーの最新の進歩に遅れずについていくことをお約束します。

***

ご覧のとおり、分散データベースは技術の大きな進歩を表しています。企業が集中型データベースから分散型モデルを採用するようになっているのは当然のことです。 Atlantic.netには、Windowsプライベートクラウドホスティング、仮想プライベートサーバー、マネージドクラウドサーバーホスティング、HIPAA準拠のホスティング、受賞歴のある超高速SSD VPSホスティングサーバーなど、さまざまな企業向けの多くのホスティングオプションがあります。


Linux
  1. リレーショナルデータベースとは何ですか?

  2. libtool の .la ファイルは何のためのものですか?

  3. vdso と vsyscall とは何ですか?

  1. Ddはいつデータのコピーに適していますか? (または、Read()とWrite()が部分的である場合)?

  2. iノードは何に適していますか?

  3. Linux のトップ コマンド:us、sy、ni、id、wa、hi、si、st (CPU 使用率) は?

  1. NoSQLデータベースとは何ですか? –NoSQLの説明

  2. リレーショナルデータベースとは何ですか?

  3. Elasticsearch分散NoSQLデータベース–それは何であり、それを使用する必要がありますか?