米Hortonworks、「Apache Hadoop」べースのディストリビューション「HDP 1.3」をリリース
米Hortonworksは5月29日、オープンソースのHadoopディストリビューション最新版「Hadoop Data Platform 1.3」をリリースした。SQL風のクエリ言語でHadoopにアクセスできる技術「Apache Hive」との統合を強化し、使い勝手を改善している。
Hortonworks Data Platform(HDP)は「Apache Hadoop」を土台とした企業向けのデータ管理プラットフォーム。大規模なデータの読み込みや処理、分析を行うためのデータ基盤技術で、必要な機能を統合し検証済みのプラットフォームとして提供する。
HortonworksはYahoo!のHadoopチームがスピンオフしたベンチャー企業で、2012年6月に最初の正式版となるHDP 1.0をリリース、その後、同年9月にバージョン1.1を、2013年2月に1.2をリリースしている。
HDP 1.3ではHadoopの最新安定版である「Apache Hadoop 1.2」を採用、関連プロジェクトも最新版を利用することで最新の機能を利用できるという。たとえばApache Hive 0.11の採用により、Apache Hiveを利用したクエリ当たりの性能は最大50倍改善するという。また、2月に同社が中心となって開始したイニシアティブ「Stinger Initiative」の取り組みにより、利用できるSQLセマンティックも拡大されているという。
NFS v3を利用したHDFSへのアクセスも可能となり、Hadoop内・外へのデータの移行が容易になった。また、OracleとNetezzaと接続できるコネクタも改良した。「Apache Hcatalog」におけるHadoopとデータベース間のデータトランスファー技術「Apache Sqoop」のサポートも強化した。
このほか、スクリプト言語の「Apache Pig」は0.11に、NoSQLデータベース「Apache HBase」は0.94.6、スケジュールとワークフロー「Apache Oozie」は3.3.2、プロビジョニングの「Apache Ambari」は1.2.3、「Apache Zookeper」は3.4.5にアップデートされている。
HDP 1.3はRed Hat Enterprise Linux、CentOS、SUSE Linux Server Enterprise向けのパッケージがあり、プロジェクトのWebサイトより入手できる。
米Hortonworks
http://hortonworks.com/