GNU/Linux >> Linux の 問題 >  >> Linux

LinuxでHive orcファイルの内容を見る方法

2020 年に回答を更新 :

@Owen の回答によると、ORC は独自の Apache プロジェクトとして成長し、成熟しました。 ORC 採用者の完全なリストは、現在、さまざまな種類のビッグ データ テクノロジでサポートされていることを示しています。

@Owen と ORC Apache プロジェクト チームの功績によると、ORC のプロジェクト サイトには、Linux ローカル ファイル システムに保存された ORC ファイルで Java または C++ スタンドアロン ツールを使用する方法に関する完全に維持された最新のドキュメントがあります。これは、元の Hive+ORC Apache wiki ページのたいまつを引き継いだものです。

元の回答の日付:May 30 '14 at 16:27

<ブロック引用>

ORC ファイル ダンプ ユーティリティには、ハイブ (0.11 以降) が付属しています:

hive --orcfiledump <hdfs-location-of-orc-file>

ソースリンク


また、Linux で実行されているデスクトップ アプリケーションで ORC ファイルの内容を表示することもできます。

Parquet や、ORC や AVRO などの他のバイナリ形式のデータを表示するデスクトップ アプリケーションがあります。これは純粋な Java アプリケーションであるため、Linux、Mac、および Windows でも実行できます。詳しくは Bigdata File Viewer をご確認ください。

配列、マップ、構造体などの複雑なデータ型をサポートします。


また、orc ファイルの内容を JSON で出力する Linux および MacOS 用のネイティブ実行可能ファイルもあります。 ORC プロジェクト (http://orc.apache.org/) を参照して、C++ ツールをビルドしてください。

% orc-contents examples/TestOrcFile.test1.orc

ネイティブのメタデータ ツールもあります:

% orc-metadata ../examples/TestOrcFile.test1.orc

ORC プロジェクトには、Java から同じことができるスタンドアロンの uber jar もあります。

% java -jar orc-tools-1.2.3-uber.jar data myfile.orc

Linux
  1. Linuxで圧縮ファイルの内容を表示する方法

  2. Linuxで.gzファイルと.tar.gzファイルを抽出する方法

  3. LinuxでNetcatを使用してファイルを転送する方法

  1. LinuxでファイルをUTF-8エンコーディングに変換する方法

  2. LinuxファイルでACLを表示または変更する方法

  3. Linux でファイルを tar および untar し、tar ファイルの内容を表示する方法

  1. Linuxでファイルを移動する方法

  2. Linuxでファイルを見つける方法

  3. Linux で MB ではなく GB で du を表示するにはどうすればよいですか?