クラスタリング用に作成された、CentOS/RHEL ベースの rocks linux ディストリビューションがあります。
rocks の長所は、ほとんどの場合、多くの詳細を管理して実行してくれることです。
- 自動インストールと再インストールが行われます。コンピュータが PXE 経由で起動できる場合、最初のインストールはノードの PXE 起動で構成されます。計算ノードが多数ある場合、パッケージの配布に内部で bittorrent を使用します。これにより、全体を (再) インストールするための重大なボトルネックが解消されます。
- デフォルトで非常に均一なコンピューティング環境が提供されます。
- デフォルトでは、NFS を内部でセットアップして使用します。また、PVFS2 を使用するためのオプションもあります (試したことはありません)。
- キューイング/バッチ システムに関しては、これをセットアップして管理する必要があります。デフォルトでは、SGE を使用していると思います。トルク用のロール (ソフトウェア バンドル形式) もあります。
- ユーザー/グループなどの一貫性を確保します。クラスタ全体
- 神経節を介してリソース使用率をグラフ化します
欠点を掘り下げるとしたら
- 計算ノードにソフトウェアを追加/削除するには、それらを再インストールする必要があります (ただし、均一性は保証されます)。
- ソフトウェアの追加/削除には、aroll の追加 (rpms/appliance をバンドルする方法) か、xml ファイルの編集が含まれます。ただし、かなり十分に文書化されているので、文書を読むことにいくらかの努力を払っても構わないと思っているなら、問題ないはずです。さらに、行き詰まった場合のメーリング リストもあります。
- CentOS/RHEL ベースで、"bleedingedge" より少し遅れています
- (ほとんどの場合) 物事を「自分のやり方で」行うことを余儀なくされます。マイナーな変更はおそらく xml-config ファイルの一部を変更することで回避できます。大きな変更は、ロールの作成、追加、または変更を通じて実装する必要がある場合があります。 (sw/addon 形式)
ベースディストリビューションとして openSUSE を持つ小さなクラスターがありますが、あまり重要ではないと思います。 Ubuntu は実行可能な代替手段のように見え、かなりのドキュメントとコミュニティ サポートがあります。 Linux の上で、Sun Grid Engine を実行しています (そして、クラスターには Mac OS マシンもかなりシームレスに含まれています) が、slurm はおそらく単純なセットアップで機能します。中央サーバーから NFS 経由でホーム ディレクトリと /usr/local を共有します。それは私たちにとってうまく機能します。詳細については、当社の Web サイト (インターネット アーカイブ経由) をご覧ください。