オープンソースのデータウェアハウスシステム「CloudBase」
企業ディレクトリサービスの米Business.com(米R.H. Donnelley Interactive傘下)は10月24日(米国時間)、「Hadoop」ベースのオープンソース・データウェアハウスシステム「CloudBase」を公開した。ANSI SQLを利用して、フラットログファイルにクエリを実行できる。SourceForge.net経由でダウンロードできる。
オープンソースの分散コンピューティング技術であるHadoopのMap-Reduce実装を利用して、フラットログファイル上にデータベース抽出層を構築した。これにより、ANSI SQLを利用して、Webサイトなどのフラットログファイルに直接クエリを実行できる。複雑なリレーショナルデータベースクラスタなしにログデータを分析できるという。
当初、Business.comなど自社サイトのWebログ分析を高速化するツールとして社内開発した技術という。今回、SouceForge.net経由で、GNU General Public License v2の下で公開した。
今後、ログパーシングの強化、ORDER BYやTOP Nの最適化などの機能強化のほか、パブリックソースコードレポジトリ、Wikiなどコミュニティ向けの機能も提供するという。
米Business.com
http://Business.com
「CloudBase」ダウンロード
http://cloudbase.sourceforge.net