Hadoop、NoSQL、クラウドストレージ向けSQLエンジン「Apache Drill 1.0」が公開

 オープンソースの非営利団体Apache Software Foundationは5月19日、Apache Hadoop、NoSQL、クラウドストレージ向けのスキーマフリーのSQLクエリエンジン「Apache Drill 1.0」をリリースした。

 Apache Drillは米Googleの開発するクエリツール「Dremel」のオープンソース実装で、WindowsおよびLinux、Mac上でApache HadoopやNoSQL型データベースなどの非リレーショナルデータストアに保存されているデータへのクエリを行える。HBase、MongoDB、MapR-DB、HDFS、MapR-FSなどのほか、Amazon S3、Azure Blob Storage、Google Cloud Storage、OpenStack Swift、NAS、ローカルファイルもサポートする。単一のクエリで複数のデータストアからのデータを集めることができ、クエリプランを自動で再構成するオプティマイザ、カラムナ実行エンジン、実行時のデータ主導のコンパイル/リコンパイル、メモリ管理などの機能も備える。

 JSONデータモデルに対応し、複雑でネストされたデータへのクエリが可能。直感的なSQL拡張機能も提供する。SQLサポートによりTableauなどのBIをそのまま利用できるのも特徴。このほか、ODBC/JDBC、Restful APIなどもサポートする。

 2012年後半にプロジェクトを開始しており、2014年12月にトップレベルプロジェクト(TLP)に昇格した。バージョン1.0は約3年を費やした開発の結果という。安定性、メモリ処理、性能にフォーカスし、コマンドラインインターフェイスもショートカットの追加などにより改善した。テキストとCSVの処理、JDBC互換性なども強化したという。

 プロジェクトによると、次期1.1のリリースは6月を予定しており、その後は4~6週間のリリースサイクルでバージョンアップしていくという。

Apache Drill
http://drill.apache.org/