バージョン2系の正式版となるApache Hadoop 2.2リリース
非営利団体のApache Software Foundation(ASF)は10月16日(米国時間)、Apache Hadoop 2系で初となる正式版という「Apache Hadoop 2.2.0」をリリースした。分散処理実行フレームワークの「YARN」の導入、Windowsの対応などが特徴となる。
Apache Hadoopは、MapReduceアルゴリズム実装を含む大規模データ向けの分散処理フレームワーク。米Yahoo!や米Facebook、米NetFlix、米Twitter、米Amazon Web Servicesなど多数の企業で利用されている。なかでもYahoo!では3万5000以上のノードを備えた環境で運用されており、既知のものでは最大規模という。
Hadoop 2.0系はアルファ、2.1系はベータの扱いだったが、Hadoop 2.2は2系で初となる正式版という扱いで、2011年12月に公開された1.0以来のメジャーマイルストーンとなる。
Hadoop 2.2の最大の特徴は、HDFS(Hadoop Distributed File System)上で動く汎用のクラスタリソース管理システム「YARN(Yet Another Resource Negotiator)」。これを利用することで、MapReduceやそれ以外のさまざまなデータ処理フレームワーク/サービスを管理できる。ビックデータアプリケーション向けの大規模な分散運用システムとして利用でき、複数のアプリケーションを同時に実行できるという。これにより、「Apache Hadoop MapReduce」や「Apache Storm」といったデータ処理型アプリケーションや「Apahce HBase」などのサービスも利用できる。
HDFSにも多数の強化が加わった。データスナップショット、高可用性、拡張性を強化するためのフェデレーションなどが加わり、NFS v3アクセスもサポートした。性能も強化し、Windowsのサポートも加わっている。
開発チームによると、2.2は安定しており、APIとプロトコルの両方の点で互換性が保たれていることから、最新版への移行を推奨している。
Apache Hadoop 2.2はプロジェクトのWebサイトより入手できる。ライセンスはApache License 2.0。
Apache Software Foundation(ASF)
http://www.apache.org/
Apache Hadoop
http://hadoop.apache.org/