米Cloudera、100%オープンソースの「Apache Hadoop」ベースディストリビューションをリリース

 米Clouderaは4月12日(米国時間)、Hadoopディストリビューション「Cloudera’s Distribution including Apache Hadoop v3(CDH3)」の一般提供を開始した。ClouderaのWebサイトより入手できる。

 CDHは、大規模なデータ統合と分散コンピューティングのためのフレームワーク技術「Apache Hadoop」を中核とし、データ管理プラットフォームを統合したディストリビューション。事前検証・統合済みで、TwitterやGrouponなどの企業が導入しているという。ライセンスはApache License。

 最新版では、前バージョンで統合していたデータウェアハウスのHive、データフローのPigなどに加え、Flume、Squoop、Hue、Zookeeper、HBaseなどのパッケージを新たに含み、標準APIにより全てのコンポーネントや機能を統合した。MapReduceジョブの処理は最大3倍高速になり、ファイルシステムのI/Oも20%改善した。機能面では、OBDCドライバを一新しMicroStrategyなどのBIクライアントの統合が可能となった。ヘテロジニアスなジョブのワークフローとスケジューリングが可能となり、セキュリティも強化した。バグの修正により、安定性も強化したという。

 Red Hat、CentOS、SUSE、Ubuntuの各Linuxディストリビューション、Java(32ビットと64ビット)をサポートした。AmazonやRackspaceの提供するクラウド環境で動かすこともできる。

米Cloudera
http://www.cloudera.com/