Google、機械学習のデータ視覚化ツール「Embedding Projector」をオープンソースで公開

 Googleは12月12日、多次元データを視覚化する「Embedding Projector」をオープンソースソフトウェアとして公開したことを明らかにした。

 Embedding Projectorは、Googleが進める機械学習研究プロジェクト「TensorFlow」の一部として開発されたWebアプリケーション。機械学習においてデータをアルゴリズムが処理できる形態にするための「埋め込み層(Embedding)」の視覚化と分析をインタラクティブに行うためのツールで、TensorFlowの視覚化ツールTensorBoardに組み込まれている。

 TensorFlowの変数を保存しているチェックポイントファイルから読み込んでデータを視覚化できるほか、スタンドアロン版もprojector.tensorflow.orgで提供する。開発者や研究者はTensorFlow自体をインストールしたり起動することなく多次元データをビジュアル化できる。また、2Dもしくは3Dモードでデータを閲覧でき、それらを拡大したり回転させることもできる。

 よく利用される手法として、主成分分析(PCA)、t-SNE((t-distributed stochastic neighbor embedding)、カスタムリニアプロジェクションの3種類を用意する。PCAはembeddingの内部構造を探るのに適しており、t-SNEはクラスタを見出すなどの用途に適しているという。カスタムリニアプロジェクションは、データセットから意味のある方向性を発見するのに適していると説明している。

Embedding Projector
http://projector.tensorflow.org/