米Oracle、大規模システム向けのJava機械学習ライブラリ「Tribuo」を公開
米Oracleは9月15日、Java機械学習ライブラリの「Tribuo」をオープンソースとして公開したことを発表した。バージョン4.0をプロジェクトのWebサイトより入手できる。
TribuoはOracle Labsの機械学習リサーチグループが開発したもので、数年がかりで大規模な運用システムに機械学習モデルを実装する過程で作成した。すでにOracle内部では数年前から運用環境で利用しているという。Tribuoとはラテン語で割り当てや配分を意味する。
Javaで作成されており、Java 8以降で動く。分類、クラスタリング、異常検出、回帰アルゴリズムなど標準的な機械学習の機能を備える。また、データ読み込みのパイプライン、テキスト処理のパイプラインもあり、読み込まれたデータ上で運用するための機能レベルの変換も用意する。
特徴として、Tribuoは各インプットを認識しているため、範囲と型を記述できるという。機能に名称をつけることもでき、機能IDとアウトプットのIDを管理できるためIDの衝突を防ぐという。型付けによりモデルの追跡でもメリットがあるとしている。
ONNX Runtime、TensorFlow、XGBoostとのインターフェイスを持ち、onnxフォーマットでモデルを保存したり、TensorFlowやXGBoostでトレーニングしてネイティブモデルとともに実装するなどのことが可能。特にonnxモデルのサポートにより、scikit-learnやpytorchなどのPythonパッケージを使ってトレーニングしたモデルをJavaで実装することができるとしている。
TribuoはプロジェクトのWebサイトより入手できる。ライセンスはApache License 2.0。
Tribuo
https://tribuo.org