ARMをサポートした「Apache Hadoop 3.3」が公開

 Apache Hadoopコミュニティは7月28日、最新安定版となる「Apache Hadoop 3.3.0」公開を発表した。ARMのサポート、Java 11ランタイムのサポートなど多数の強化が加わっている。

 Apache Hadoopはオープンソースの分散処理フレームワーク。共通ツールのHadoop Common、分散ファイルシステムHadoop Distributed File System(HDFS)、ジョブスケジューリングとクラスタリソース管理のフレームワークHadoop YARN、YARNベースの並列処理システムHadoop MapReduce、オブジェクトストアHadoop Ozoneなどのモジュールで構成される。

 Apache Hadoop 3.3は2019年1月に公開されたバージョン3.2に続く3系の最新版。2020年になって初のリリースとなり、バージョン3.2から2100件以上のバグの修正と強化が加わった。

 ARMアーキテクチャをサポートした。Java 11ランタイムのサポートが安定扱いとなった。

 Protocol Buffersがバージョン2.5から3.7.1になった。Protocol BuffersはGoogleが開発する言語中立型の構造化データのシリアライズのための仕組みで、アップデートは、バージョン2.5がサポート終了を迎えたことを受けてのもの。

 HadoopメトリクスをPrometheusをエクスポートできるようになった。デフォルトでは無効となっておりhadoop.prometheus.endpoint.enabledをtrueに設定することで、Hadoopデーモンの/promエンドポイントからPrometheusと親和性のあるフォーマットでメトリクスを得られる。

 AuthenticationFilterのなりすまし防止メカニズムをサポートした。HDFS Router based Federation(RBF)がKerberos認証に対応した。このほかにも、バグの修正なども加わった。

 Amazon S3でも多数の強化が加わり、Delegation Tokenのサポート、404キャッシュ処理、S3guard性能の性能などが改善している。

 YARNアプリケーションの編集と検索インターフェイスを持つアプリケーションカタログシステムを導入した。YARNにNodeManager(NM)でキュー・実行できるOPPORTUNISTICコンテナが加わった。既存のGUARANTEEDコンテナよりも優先度が低く、中央のYARN RM、分散スケジュールなどを通じて分散スケジュールが可能になった。

 このほかにも多数の強化が加わっている。

Apache Hadoop
https://hadoop.apache.org/