Apache Hadoopストレージ層を補完するストレージエンジン「Apache Kudu 0.8」公開

 オープンソースのストレージエンジン「Apache Kudu」の開発チームは4月11日、最新版「Apache Kudu 0.8.0」をリリースした。

 Apache Kuduは構造化データ向けのストレージエンジン。高速な挿入/更新とカラムスキャンによる効率の良い解析アクセスパターンや低遅延のランダムアクセスをサポートし、Apache Hadoopのストレージ層を補完して高速な分析が可能になるとしている。Apache HBaseとの違いとして、HBaseはスキーマレスであるのに対し、Kuduのデータモデルはリレーショナルに近いなどの点で異なる。

 インメモリ処理と最新のハードウェア技術を活用するように設計されており、頻繁に変化するデータ上での高速な分析に適しているとしている。KuduはもともとCluderaが開発し、Apache Software Foundation(ASF)に寄贈、ASFのインキュベーションプロジェクトとして開発が進んでいる。

 Kudu 0.8は2月に公開されたバージョン0.7に続く最新版となる。新機能として、ログデータ収集の分散システムであるApache Flumeのシンクを実装した。

 このほか、パーティションプルーニングをC++クライアント向けに実装(Javaクライアント向けはサポートしていない)、クエリの余分な作業を省略できるという。Javaクライアントでのエラー処理を改善したほか、RPCスケジュールでearliest-deadline-firstを利用するよう変更、これによりRPCスレッドのバックログの処理時のサービスキューの振る舞いを改善するという。バグも修正し、安定性も強化された。

Apache Kudu
http://getkudu.io/