データオーケストレーションツール「Apache Hop 2」が公開
Apache Hop PMCおよびコミュニティは6月2日、ETL開発ツールの最新のメジャーリリースとなる「Apache Hop 2.0.0」の公開を発表した。Java 11のサポートなどが加わっている。
Apache Hopは”Hop Orchestration Platform”の頭文字を取ったもので、データとメタデータのオーケストレーションプラットフォーム。ビジュアル開発、一度設計すればどこでも動くワークフローとパイプラインなどを特徴とし、新しいデータ統合をを目指す。ローカルまたはリモートのHopネイティブエンジン、Apache Beam経由でApache Spark、Apache Flink、Google Dataflow、AWS EMRなどで動かすことができる。2021年12月にApache Software Foundationのトップレベルプロジェクト(TLP)に昇格した。
Apache Hop 2.0は2021年10月にリリースしたバージョン1に続くメジャーリリース。Java 11に対応した。ビルドについてもこれまでのJava 8からJava 11にアップグレードしたことから、メジャーリリースとして公開したと説明している。合わせて、Apache Beamも2.38にアップグレードされたほか、Apache Spark 3.1.3、Apache Flink 1.14.4など新しくなった。
変換グラグインでは、JSONフォーマットまたはAvroバイナリに変換するApache Avro File Outputが加わった。Apache Dorisに大量のデータを高速に挿入するApache Doris Bulk Loader、次の行を収集し、ルールセットに対して実行するDrools Rules Accumulator/Drools Rules Executorも加わった。パイプラインのフィールドでExcel風のフォーミュラと関数を適用できるFormulaも加わった。このほかにも細かな機能が加わっている。
Apache Hop
https://hop.apache.org