「Apache Hive 2.3」がリリース
Hadoop向けデータウェアハウスソフトウェア「Apache Hive」の開発チームは7月19日、最新版となる「Apache Hive 2.3.0」をリリースした。
Apache Hiveは、SQLに似たクエリ言語「HiveQL」を利用して分散ストレージにある大規模なデータセットを操作できるオープンソースのデータウェアハウスソフトウェア。Apache HDFSファイルに直接アクセスする、もしくはApache HBaseなどのデータストレージにアクセスすることで、Apache Hadoop上にあるデータのクエリや操作を行える。クエリはApache Hadoop MapReduceやApache Tezフレームワーク経由で実行され、コマンドラインツールやJDBCドライバも提供する。米FacebookがApache Software Foundationに寄贈、Apache Hadoopのサブプロジェクトとして開発されていたが、現在は単独のトップレベルプロジェクトとして開発が進んでいる。
Apache Hive 2.3は2016年3月に公開したバージョン2系の最新版。バグ修正が中心だが、ACIDでベクトル化を改善したほか、UDFの追加によってUniontypeの値の問い合わせが可能になるなどの強化が加わっている。また、LLAP(Low Latency Analytical Processing)も多数の改善が加わっている。
Apache Hive
https://hive.apache.org/