オープンソースの機械学習システム「Apache SystemDS 3」が公開

 The Apache SystemDSチームは7月5日、オープンソースの機械学習システムの最新のメジャーリリースとなる「Apache SystemDS 3.0.0」を発表した。

 Apache SystemDSはオープンソースの機械学習システム。データの統合から、クリーニング、機能開発、トレーニング、実装、サービスまでエンドツーエンドでサポートする。R言語/Pythonに似た宣言的言語スタックを備え、用途に合わせて使うことができる。

 元々は米IBMがSystemMLとして開発していたものをApache Software Foundation(ASF)に寄贈、「Apache SystemML」というインキュベーションプロジェクトとしてスタート、その後名称をSystemDSに変更している。トップレベルプロジェクトには2017年に昇格した。メジャーリリースとなるバージョン3では、Java 11とApache Spark 3をサポートした。

 マルチテナントをサポートした。テナント隔離、テナント間連携のための再利用、連携されたワークロード向けの圧縮機能なども用意した。 Top-Kクリーニングフレームワークをサポートした。効果的なデータクリーニングパイプラインを自動で生成するという。Unified Memory Managerの初期サポート、CUDAコード生成・オペレーターの統合(実験的)なども加わった。このほか、マルチスレッド機能変換のパフォーマンスと利便性の改善、Pythonのチュートリアルなど、多数の細かな機能強化も加わっている。

Apache SystemDS
https://systemds.apache.org