Google、機械学習用データの分析ツール「Facets」をオープンソースで公開

 Googleは7月17日、機械学習データのビジュアル化ツール「Facets」をオープンソースで公開した。機械学習のトレーニングデータセットやテストデータセットなどに利用することで、さまざまなレベルでデータの全体像を見ることができるという。

 Facetsは学習に使用するデータセットを分析できるツールで、人とAIとの関連を研究する目的でGoogleが7月10日に発表したイニシアティブPAIR(People + AI Research Initiative)との協業により開発された。

 データセットにおける各特徴ごとの値の分布を統計処理して表示する「overview」機能と、インタラクティブに多数のデータを閲覧・確認できる「dive」機能を持つ。どちらも特徴値を中心とした表示やブラウジングが可能となっており、データセット中の特徴値の傾向や分散を把握したり、予期しない特徴値を見つけ出すといった作業を支援できる。

 Facetsのビジュアル化機能はWeb ComponentsライブラリであるPolymerを使い、TypeScriptベースで実装されている。そのため、容易に任意のWebアプリケーションやWebページに組み込んだり、データ分析ツール「Jupyter Notebook」などで利用できるという。

 FacetsはプロジェクトのWebサイトより入手できる。ライセンスはApache License 2。

Facets
https://pair-code.github.io/facets/