Google、TensorFlowのトレーニングのためのライブラリ「Tensor2Tensor」をオープンソースで公開
Google Brainチームは6月19日、「Tensor2Tensor(T2T)」を公開した。Pythonベースのワークフロー組織化ライブラリで、TensorFlowの機械学習モデルの構築と学習処理を行えるという。
GoogleはディープラーニングのためのツールキットであるTensorFlowを2015年秋にオープンソースで公開したが、TensorFlowで使用するモデルをどのように学習させるかという点では課題が残っていた。Tensor2Tensor(T2T)はこの課題を解決するためのもので、汎用化されたSequence to Sequence(Seq2Seq)モデルを実装したライブラリとなる。ライセンスはApache License 2。
学習用のデータセット、学習タスクの記述のためのツール、よく利用されるモデル、学習プロセスの設定・制御のためのハイパーパラメーターセット、学習ライブラリのパラメーターを特定できるトレイナーで構成される。
これを利用して、翻訳やパーシング、画像認識といったの機械学習アプリケーション向けのモデルを容易に作成でき、TensorFlowを応用するアイディアを素早く試すことができるという。ユーザーはまた、自社のモデルとデータセットをT2Tに加えることもできる。
例えば、T2Tに含まれている「Attention Is All You Need」で用いられた翻訳モデル「Transformer」の場合、8GPUで3日間の学習時間、BLEUスコア(機械翻訳の自動評価スコア)は7.8アップの28.4と報告している。
Tensor2Tensor(T2T)
https://github.com/tensorflow/tensor2tensor