米Intel、ビックデータ対応のグラフ構築ライブラリ「GraphBuilder」を公開

 米Intelは12月6日、Apache Hadoopを利用するビックデータ解析ライブラリ「GraphBuilder」を発表した。大規模データを解析してグラフを作成するためのJava向けオープンソースライブラリで、現在ベータ版が公開されている。

 GraphBuilderは、Intelが米ワシントン大学と共同で開発したオープンソースのJavaライブラリで、ワシントン大学の研究者Carlos Guestrin氏らがグラフベースの並列マシン学習向けフレームワーク「GraphLab」を開発した後、GraphLabなどのフレームワークを利用して大規模なグラフを構築するために開始したプロジェクト。Guestrin氏はIntelのScience and Technology Center for Cloud Computingのメンバーでもあるため、Intelとの共同プロジェクトとなったようだ。GrapheLabはビックデータを並列コンピューティングおよびMapReduceで処理するというテーマに取り組むべく開発したもので、一般的な手法と比べ20〜50倍高速にグラフを処理できるという。データ解析や機械学習といったアプリケーションなどでの利用が想定されている。

 GraphbuilderはMapReduce型の並列プログラミングモデルを採用し、Hadoopを使って分散処理を行うのが特徴。これにより、大規模なデータセットに対しそのデータ間での関連性(リレーションシップ)を示すグラフの構築を行えるという。大規模なグラフを高速に構築できるほか、グラフ構造で必要なデータクリーニング、圧縮、パーティション、シリアル化といった処理をGraphBuilderに任せることができ、誰もが研究や商用目的に大規模なグラフを構築できるとしている。処理にはMapReduceの並列プログラミングモデルを利用するため、拡張性もあるという。

 IntelらはGraphBuilderのデモを7月に行っており、このたび01.orgにてオープンソースで公開した。ライセンスはApache License 2.0。

米Intel
http://www.intel.com/

GraphLab
http://graphlab.org/

GraphBuilder
https://01.org/graphbuilder/