Hadoop開発を容易にする「Spring for Hadoop 1.0」が登場

 SpringSource(米VMware傘下)は2月26日、「Spring for Apache Hadoop 1.0」をリリースした。Java向けのアプリケーションフレームワーク「Spring Framework」に「Apache Hadoop」を利用するための機能を組み合わせたもので、Hadoopアプリケーションの開発を容易にするという。

 2012年2月に初のマイルストーンを公開以来、ちょうど1年を経ての正式版リリースとなった。Spring FrameworkからHadoopのMapReduceクエリを利用する、といったことが可能で、Spring Frameworkを利用したHadoopアプリケーションの開発を容易にすることを目指すという。ライセンスはApache License 2.0を採用する。

 SpringのTemplate APIデザインパターンを応用、HBase向けの基本的な設定機能を提供するHBaseTemplate、Apache Hiveと統合できるHiveTemplate、PigサポートのPigTemplateなどのクラスを提供する。CascadingなどのJava APIは、追加の変更が必要な場合もあるが、Spring FrameworkのJava設定から利用できるという。これらにより、一貫性のあるプログラミング/設定モデルをHadoopエコシステムに提供するという。

 小さい規模のプロジェクトをあとから複雑なプロジェクトに拡張できるスケーラビリティも特徴で、Hive、Pigスクリプト、MapReduceのジョブ、Cascadingフローなどを実行できるRunnerクラスを導入した。JDKインターフェイスのCallableからJVMべースのスクリプト呼び出しも可能。Runnerを組み合わせて利用できるが、Spring Batchに容易にアップグレードできるという。

 Spring for HadoopはプロジェクトのWebサイトよりダウンロードできる。さまざまなHadoop 1系ディストリビューション(Apache Hadoop、Cloudera CDH3/CDH4、Greenplum HDなど)との検証作業も進めているという。

Spring for Apache Hadoop
http://www.springsource.org/spring-data/hadoop

米SpringSource(米VMware傘下)
http://www.springsource.org/