Apache CassandraとApache Hadoopを一体化した「Brisk」発表

 「Apache Cassandra」の商用サービスを提供する米DataStaxは3月22日(米国時間)、Cassandraと「Apache Hadoop」を組み合わせたディストリビューション「Brisk」を発表した。1カ月半後のリリースに向け、ユーザー登録を開始している。

 Apache CassandraとApache Hadoopはともに非営利団体Apache Software Foundation(ASF)のオープンソースプロジェクト。Apache Cassandraは元々は米Facebookで開発された技術。オープンソースの分散データベース管理システムで、大規模データ用の拡張性などを特徴とする。一方、Apache Hadoopは米Yahoo!がASFに寄贈した技術で、大規模データ用の分散コンピューティング用ソフトウェアとなる。

 DataStaxが発表したBriskは、HadoopとHadoopベースのデータウェアハウスインフラ「Hive」にCassandraを組み合わせたもの。CassandraのHDFS(Hadoop File System)互換ストレージレイヤ上にHadoopのMapReduce、Hive、ジョブ追跡、タスク追跡機能を統合し、Cassandraのリアルタイム機能を利用できるようにした。

 同社が調べた利用動向によると、Cassandraで保存し、Hadoopに移して分析する傾向が強いが、BriskによりCassandraのクラスタ上でデータをすぐに分析できるという。さらには、Cassandraのコアアーキテクチャを活用することで、ワークロードの干渉も防ぐという。単一の統合ソリューションとして導入できるため、効率を改善しコストを削減できるとしている。

 Briskは45日以内にオープンソースでリリースされる予定。ライセンスはApache Licence。

米DataStax
http://www.datastax.com/