Hadoop環境で利用できるデータベース「Apache HBase」、多数の変更が加えられたバージョン1.0をリリース
2月24日(米国時間)、Hadoopデータベース「Apache HBase 1.0」がリリースされた。「プロジェクトにおける大きなマイルストーン」とされており、7年間の開発の集大成であるとともに、先のメジャーリリースから多数の変更が加えられているという。
Apache HBaseはJavaで実装された分散型の非リレーショナルデータベース。GoogleのBigtable論文に基づいており、Hadoop Distributed File System(HDFS)上で動く。一貫性のあるリードとライト、リージョンサーバー間の自動フェイルオーバー、テーブルの自動シャーディング、リアルタイムクエリ向けのブロックキャッシュとブルームフィルタなどの特徴を持つ。クライアントアクセス向けのJava APIも備える。米Apple、米Facebook、米Salesforceなどで利用されている。
2014年2月に公開された1つ前のメジャーリリース版であるバージョン0.98からは1500以上の変更があったという。バージョン1系の土台としての機能強化が加わり、安定性を損なうことなく性能を強化したとしている。
変更点としては、新しいAPIの導入や一部のクライアントサイドAPIの変更がある。拡張性を強化し、将来に向けて利用を容易にすることを目的としており、本バージョンよりクライアントサイドAPIはInterfaceAudience.Publicクラスとして扱われるようになった。一方で、HTableInterface、HTable、HBaseAdminなど一部のAPIが非推奨となっている。非推奨のAPIは2系で削除されるため、APIのアップデートを呼びかけている。
実験的機能として、「Read availability using timeline consistent region replicas」が加わった。コピーのうちの1つをプライマリとし書き込みを受け付け、ほかのコピーは同じデータファイルを共有するというもの。また、リージョンサーバーを再起動することなくサーバー設定のサブセットを読み込める機能も加わっている。これらに加え、使い勝手や外観も改善したという。
開発チームによると、1.0以降はセマンティックバージョ二ングを取り入れるとしている。0.98系については、ユーザーコミュニティがサポート終了の準備ができるまでメンテナンスを続けるという。
Apache HBase
http://hbase.apache.org/