Hadoop上にデータウェアハウスシステムを構築できる「Apache Hive 1.0.0」リリース

 「Apache Hadoop」ベースのデータウェアハウス構築ソフトウェア「Apache Hive 1.0.0」がリリースされた。バージョン0.14.1として開発されていたもので、本バージョンよりバージョン番号の付け方が変更されている。

 Apache Hiveは米Facebookで始まったプロジェクトで、分散ストレージ環境での大規模なデータセットのクエリや管理を簡素化するためのソフトウェアとなる。Apache Software FoundationではApache Hadoopのサブプロジェクトとしてスタート、その後トップレベルプロジェクト(TLP)に昇格している。Javaで実装されており、SQLに似た言語「HiveQL」を利用してデータの抽出やクエリが可能であるほか、Map/Reduce開発者はカスタムのマッパーに組み込むこともできる。

 2014年4月に公開されたバージョン0.13に続くもので、当初は0.14.1として開発されていた。本バージョンからバージョン番号付けルールが変更されており、次のバージョンは「1.1.0」としてリリースされる予定。大きな変更点としてはHiveMetaStoreClientを公開APIにするための作業がスタートしたことと、「HiveServer 1」の削除の2点が挙げられている。また、API関連ドキュメントの整備も開始されたとのこと。Apache HiveはすでにJDBCやODBCをサポートし「Apache Sentry」ベースの認証が可能なHiveServer 2を導入しており、HiveServer 1の削除はエンタープライズ対応に不可欠としている。

 このほか「Apache Tez」がバージョン0.5.2にアップグレードするといった細かな機能強化やバグ修正も行われている。

 Apache Hive 1.0はHadoop 1系と2系に対応、プロジェクトのWebサイトより入手できる。

Apache Hive
https://hive.apache.org/