米Hortonworks、Hadoopデータプラットフォーム「Hortonworks Data Platform 2.2」ベータ版を発表

 分散処理フレームワーク「Apache Hadoop」技術ベンダーの米Hortonworksは10月15日、オープンソースのHadoopデータ処理基盤「Hortonworks Data Platform(HDP)2.2」を発表した。技術プレビューを同社Webサイトよりダウンロードできる。一般公開(GA)は11月の予定。

 Hortonworks Data Platform(HDP)は企業向けのHadoopデータプラットフォーム。クラスタ管理システム「YARN」をアーキテクチャの中心とし、バッチ、インタラクティブ、リアルタイム、ストリーミング、検索などのデータ処理が行える

 HDP 2.2は4月に公開されたHDP 2.1に続く最新版となる。SQLと「Apache Hive」との統合を強化するべく、ACIDトランザクションでのSQLセマンティックを強化し、コストベース最適化によるHiveの性能強化が図られた。これはSQLセマンティック、速度、拡張性強化を目標にHiveコミュニティと進めている「Stringer.next」イニシアティブのフェイズ1と位置づけている。

 YARN対応エンジンも強化し、機械学習などのデータサイエンス手法としてサポートしてきた「Apache Spark」をYARN統合として提供する。YARN上の「Apache HBase」や「Apache Accumulo」、「Apache Storm」はGA扱いとなった。また、モノのインターネット(Internet of Things)向け機能としてHadoop向けメッセージシステム「Apache Kafka」の統合が行われており、リアルタイムでHadoopにイベントをストリームできるという。YARNに対しては、CPUスケジューリング、CPUリソース分離機能サポートなどの強化が図られた。

 クラスタセキュリティポリシーでは、「Apache Ranger」(旧名称「Apache Argus」)がStormおよび「Apache Knox」と統合可能となり、HiveおよびHBaseのポリシーを強制できるようになった。Hadoopの管理・モニタリングでは「Apache Ambari」の利用を進め、クラスタ実装にテンプレートを用いるAmbari BlueprintsやUI機能のプラグインなどカスタマイズ管理などの機能を提供する。

 2.2ではまた、「Apache Falcon」の機能を拡張し「Microsoft Azure」「Amazon S3」の両クラウド向けの自動バックアップが可能となった。ローリングアップグレードにも対応、HDFSの高可用性機能を利用してクラスタを閉鎖することなくソフトウェアを更新できるという。

米Hortonworks
http://hortonworks.com