米Microsoft、ディープラーニングツールキット「CNTK」をオープンソースとして公開

 米Microsoftは1月25日、ディープラーニング(深層学習)ツールキット「Computational Network Toolkit(CNTK)」をオープンソースとして公開したことを発表した。「TensorFlow」などほかのディープラーニング関連ライブラリよりも高速に動作するのが特徴だという。

 Computational Network Toolkit(CNTK)はMicrosoft社内でコンピューターによる話し言葉の理解の改善速度を加速する目的でボランティアプロジェクトとして開発されたツールキット。有向グラフを利用してニューラルネットワークを一連の演算的ステップとして記述する。葉ノードは入力値またはネットワークパラメーターを表現し、入力に応じて行列演算を表現するノードを含む。複数のGPUとサーバーをまたいだ並列処理と自動差別化を持つ確率的勾配降下(SGD)モデルを実装、順伝播型のfeed-forward DNN、畳み込みのニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)とLSTM(Long Short Term Memory Network)などのモデルタイプに利用できるという。

 速度を重視して開発しており、コミュニケーション機能によりディープラーニングのモデル構築によく利用されている「Theano」や「TensorFlow」、「Torch 7」、「Caffe」といったツールキットよりも優れた性能が出ていると報告している。4つのGPUを使用した場合の秒あたりフレーム処理数は約4万で、これはTorch 7やCaffeの2倍近くとなる。また、複数台のマシンを使った構成を取れるのも特徴で、4GPU搭載のマシン2台を使用した構成でのフレーム処理数は7万近くとなっている。ディープラーニングタスクは完了までに数週間かかることもあり、高速性は課題となっているという。

 CNTKはGitHubのページよりダウンロードできる。ライセンスはMIT License。

CNTK
https://github.com/Microsoft/CNTK