LinkedInがJava向け機械学習ライブラリ「Dagli」を公開

 LinkedIn(米Microsoft傘下)の技術チームは11月10日、Java向け機械学習ライブラリ「Dagli」をオープンソースとして公開した。

 DagliはJavaおよびJava仮想マシン言語向けの機械学習ライブラリ。機械学習のモデル定義フレームワークで、DAG(有向非巡回グラフ)として定義でき、トレーニングと推論の両方に利用できる単一のモデルパイプラインを持つ。

 読みやすいパイプライン定義、静的型付けなどの特徴を備え、パイプラインを単一オブジェクトとしてシリアライズ/逆シリアライズできる。速度では、トレーニングと推論の両方で並列マルチスレッド化を利用でき、グラフ最適化、ミニバッチ処理なども備える。

 パイプラインではコンポーネントとして、ニューラルネットワーク、ロジスティック回帰、勾配ブースティング決定木(GBDT;Gradient Boosting Decision Tree)、自然言語処理技術のFastText、交差検証などのツールも含み、すぐに利用できるという。

 移植性にも優れ、サーバーのほか、Hadoop、CLI(コマンドラインインターフェイス)、開発者のIDE(統合開発環境)などで動かすことができる。

Dagli
https://github.com/linkedin/dagli