分析エンジン「Apache Kylin 2.1」リリース、RDBMSをデータソースとして利用することが可能に
分散型分析エンジン「Apache Kylin」プロジェクトは8月18日、最新版となる「Apache Kylin 2.1」を公開した。
Apache KylinはJavaで実装されたオープンソースの分散型分析エンジン。ビックデータ向けのエクストリームOLAP(online analytical processing、オンライン分析処理)エンジンで、Apache Hadoopの大規模なデータセット上でSQLインターフェイスとOLAPを提供できる。当初は米eBayで開発されていたもので、2014年にApache Software Foundation(ASF)に寄贈されていた。その後2015年12月にトップレベルプロジェクトに昇格している。
Apache Kylin 2.1は、4月末に公開した2系初のポイントリリースとなる。100以上のバグ修正と強化が加わっており、新機能としてはRDBMSをデータソースとして利用できるようになった。プロジェクトレベルでのクエリの認証が可能となり、Webで直接モデルのメタデータを編集できるようになった。事前に準備していたモードなどの原因でクエリをサポートできない場合、クエリを元々のソースに戻すようになった。
また、Apache Spark 2.1のサポートが加わった。グローバルディレクトリ、DistributedLock、CuboidSchedulerなどの機能もリファクタリングされ、サブクエリも多数改善した。ストリーミングパーサーで1件のインプットメッセージで複数のストリーミングメッセージを生成できるようになった。HBaseのエラー報告も強化されている。
Apache KylinはプロジェクトのWebサイトより入手できる。
Apache Kylin
https://kylin.apache.org/