Hadoopベースのデータウェアハウス「Apache Tajo 0.10」リリース
Apache Software Foundationは3月9日、Apache Hadoopをベースとするオープンソースのデータウェアハウスシステム「Apache Tajo 0.10.0」をリリースしたことを発表した。Oracle、PostgreSQLのカタログをサポートするなどの機能強化が加わっている。
Apache Tajoは堅牢なビックデータリレーショナル/分散データウェアハウスシステム。SQL標準をサポートし、HDFS(Hadoop Distributed File System)上に保存された大規模なデータセットに対しETL(抽出・加工・ロード)操作が可能で、低遅延で拡張性のあるアドホッククエリを行うことができる。プロジェクトは2014年4月にトップレベルプロジェクト(TLP)に昇格している。
0.10は2014年10月にリリースされた0.9に続くものとなる。新機能としては、サードパーティのデータベースとの接続を強化し、OracleおよびPostgreSQLカタログストアをサポートした。また、JSONファイルフォーマットをフルサポートしたほか、HBaseストレージ統合により、直接HBaseのテーブルにアクセスできるようになった。
これらに加えて、JDBCドライバーを改善しJDBCアプリケーションの利用が容易になった。Amazon Simple Storage Service(S3)のサポートも改善した。
Apache TajoはプロジェクトのWebサイトより入手できる。
Apache Tajo
http://tajo.apache.org/