GNU/Linux >> Linux の 問題 >  >> Linux

分散型、並列型、フォールト トレラントなファイル システム

実際、現実的な選択肢はそれほど多くないと思います。好みの順に並べると、次のようになります:

<オール>
  • Amazon S3。すべての要件を満たし、オプションの品質も満たします。アップタイムとサポートの非常に優れた実績があります。社内ではありません。しかし、それは実際に回避できる要件ではないのですか、f.x. VPN アクセスを使用するか、古き良き HTTPS を使用するか... WAN の遅延と Amazon の価格設定がうまくいくなら、S3 が私の最初の選択肢です。 価格設定がうまくいかない場合は、DYI ソリューションが実際に大幅に安価になるとは思えません...
  • MogileFS はあなたの要求に完璧に合っているようです。 MogileFS に関する活動はそれほど多くありませんが、それは主に、(比較的少数の) ユーザーに対して意図したとおりに機能しているためです。
  • Lustre はその背後に本当に優れた技術を備えており、通常のローカル POSIX ファイルシステム (それが有益な場合) であり、何年にもわたって継続的に更新されてきました。大きな問題は、Sun と Oracle の合併全体が Lustre に影響を与えるかどうかです。長期的には、Sun がそのカードを適切に使用すれば、ZFS と Lustre を 1 つ屋根の下に置くことで、非常に良い結果が得られる可能性があります...現在、Lustre は主に学術および商用の HPC イニシアチブで使用され、インターネット アプリケーションでは使用されていないと思います --これは真実ではないかもしれませんが、Lustre がインターネット アプリケーションでうまくいっているのであれば、その事実をうまく売り込んでいないことは確かです...
  • Hadoop Distributed File System (HDFS) は、IMHO の要件に一致しません。 HDFS はすばらしいものですが、そのビッグテーブルのようなアプローチは、上記のファイルシステムよりもアクセスしにくいことを意味します。もちろん、大規模なスケーラビリティと長期的な展望を本当に求めているのであれば、HDFS が最適かもしれません。Yahoo、Facebook などは Hadoop の成長に投資しています。

    1 つのコメントとして、上記のシステムのほとんどは、冗長性を実現するためにファイル全体を 2 ~ 3 ノードにコピーします。これは、パリティ エンコーディング / RAID スキームよりも多くのスペースを占有しますが、大規模に管理でき、誰もが採用したソリューションのようです。したがって、あなたが言及した 75% の効率は得られません...


    私だったら、GlusterFS を使用します。現在のリリースは非常に安定しており、HPC とインターネット スペースの両方で非常に大規模なインストールを行っている人々が、実稼働システムでこれに依存していることを知っています。基本的には、必要に応じてコンポーネントをレイアウトすることで、ニーズに合わせて調整できます。 Lustre とは異なり、専用のメタデータ サーバーがないため、中心的な障害点が最小限に抑えられ、セットアップのスケーリングが容易になります。

    残念ながら、パフォーマンスを低下させずに 75% の基準を満たす簡単な方法はないと思います。

    コモディティ ハードウェアで動作しますが、Infiniband 相互接続を使用すると、パフォーマンスが大幅に向上します。幸いなことに、最近の IB の価格は非常に低くなっています。

    Scalable Informatics の担当者とその解決策としての Jackrabbit 製品をチェックしてみてください。彼らはハードウェアで GlusterFS をサポートしており、そのソリューションの価格は、何かをゼロから組み立てるコストに匹敵します。


    Linux
    1. noatimeでLinuxシステムのパフォーマンスを向上させる

    2. すべてのファイルを個別に GZip

    3. ローカル ディスク キャッシュを備えた分散ファイル システム

    1. スーパーブロック、iノード、Dentry、およびファイル?

    2. Awkからファイルをキャットする方法は?

    3. 分散ファイルシステムとクラスターファイルシステムの違いは?

    1. CWPファイルシステムロック

    2. system() の出力をファイルにリダイレクトする方法は?

    3. Docker コンテナのファイル システムの探索