Apache Hiveとは何ですか? Apache Hiveデータウェアハウスソフトウェアは、分散ストレージにある大規模なデータセットのクエリと管理を容易にします。 Hiveは、このデータに構造を投影し、HiveQLと呼ばれるSQLのような言語を使用してデータをクエリするメカニズムを提供します。公式サイトでもっと読む
このハウツーガイドは、簡単な手順でHadoopを使用してCentOS/RHELにApacheHiveをインストールするのに役立ちます。
ステップ1:JAVAとHadoopをインストールする
ApacheHiveにはJava6以降のバージョンが必要でした。また、システムにapache hiveをインストールする前に、最初にhadoopをインストールする必要があります。以下のリンクを使用してインストールしてください
CentOSおよびRHEL7/6/5にJAVAをインストールする手順
LinuxにHadoopをインストールする手順
ステップ2:Hiveアーカイブをダウンロードする
Linuxシステムでhadoopを正常に構成した後。ハイブのセットアップを開始しましょう。まず、最新のハイブソースコードをダウンロードし、次のコマンドを使用してアーカイブを抽出します。
# cd /home/hadoop # wget http://archive.apache.org/dist/hive/hive-0.12.0/hive-0.12.0-bin.tar.gz # tar xzf hive-0.12.0-bin.tar.gz # mv hive-0.12.0-bin hive # chown -R hadoop hive
ステップ3:環境変数を設定する
ハイブアーカイブファイルを抽出した後、hadoopユーザーに切り替えて、次の環境変数を設定します。
# su - hadoop $ export HADOOP_HOME=/home/hadoop/hadoop $ export HADOOP_PREFIX=/home/hadoop/hadoop $ export HIVE_HOME=/home/hadoop/hive $ export PATH=$HIVE_HOME/bin:$PATH
ステップ4:Hiveを起動する
ハイブを実行する前に、 / tmpを作成する必要があります および/user / hive / Warehouse Hiveでテーブルを作成する前に、HDFSでchmod g+wを設定します。次のコマンドを使用します。
$ cd /home/hadoop/hive $ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp $ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse $ $HADOOP_HOME/bin/hadoop fs -chmod g+w /tmp $ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouse
次のコマンドを使用してハイブの使用を開始しましょう。
$ bin/hive Logging initialized using configuration in jar:file:/home/hadoop/hive/lib/hive-common-0.12.0.jar!/hive-log4j.properties hive>の構成を使用して初期化されました
ステップ5:デモテーブルを作成してテストする
この段階で、ハイブが正常にインストールされました。次のコマンドを使用してサンプルテーブルを作成しましょう
hive> CREATE TABLE demo1 (id int, name string); OK Time taken: 6.565 seconds
以下のコマンドで作成したテーブルを表示します。
hive> SHOW TABLES; OK demo1 Time taken: 0.231 seconds, Fetched: 1 row(s)
以下のコマンドを使用してテーブルを削除します。
hive> DROP TABLE demo1; OK Time taken: 2.393 seconds
apacheハイブの公式サイトでハイブのSQL操作の詳細をご覧ください。