ストリーム処理フレームワークの「Apache Flink 1.11」が公開

 オープンソースの分散ストリーム処理の「Apache Flink」開発チームは7月6日、最新安定版となる「Apache Flink 1.11.0」を公開した。

 Apache Flinkはオープンソースのストリーム処理フレームワーク。JavaとScalaで作成された分散ストリームデータフローエンジンを持ち、Kubernetes、Yarn、Apache Mesosなどのリソース、HDFS、Amazon S3などのストレージを利用できる。

 Apache Flink 1.11は2月に公開された1.10に続く最新版。

 中核のデータフローエンジンで、新しいチェックポイントの仕組みとなるUnaligned Checkpointsをベータ導入した。バックプレッシャー下でチェックポイントの性能を改善するという。デフォルトでは無効となっており、チェックポイントの設定から有効にする必要がある。

 バッチとストリーミングの実行を統一することでソースの実装を簡素化するSource APIを導入した。

 ウォーターマークゼネレーターの2種類インターフェイス(AssignerWithPunctuatedWatermarks、AssignerWithPeriodicWatermarks)を単一のインターフェイス(WatermarkGenerator)に統合した。新しいコネクタの実装やウォーターマークの排出の管理などが改善するとしている。

 このほか、Flink SQLではChange Data Capture(CDC)の導入、Python UDFのサポートなどが加わり、PyFlinkも強化が加わっている。

Apache Flink
https://flink.apache.org/