Google、TensorFlowで実装したニューラルネットワークフレームワーク「SyntaxNet」と「Parsey McParseface」を公開

 Googleは5月12日、TensorFlowで実装したニューラルネットワーク向けフレームワーク「SyntaxNet」を公開した。自然言語理解(NLU:Natural Language Understanding)システムの土台として利用できるという。合わせて英文向けのパーシング(解析)モデル「Parsey McParseface」も公開した。

 SyntaxNetは自然言語向けの構文解析フレームワークで、データ上でSyntaxNetモデルをトレーニングするのに必要なコードや英文テキストの分析に利用できる英語のパーサー「Parsey McParseface」を含む。TensorFlowはGoogleが開発した機械学習ライブラリで、オープンソースとして公開している。

 人間の言語の曖昧さはパーシングの大きな課題となっており、自然言語パーサーは考えられる代案を検索して文脈に即したもっともらしい構造を見出す必要があるという。Parsey McParsefaceはGoogleが開発した機械学習アルゴリズム上に構築したパーサーで、言語学的な構造の分析を学習する。任意の文章における各言語の機能的役割を分析できるという。ビームサーチという検索技術との組み合わせにより、94%の精度を達成可能としている。きちんとフォーマットされたテキストの場合、人間のパフォーマンスに近いレベルに達しつつあるとしている。精度は完全ではないが、多くの場合で十分に利用できるレベルという。

 Googleは今後、知識を学び、全ての言語と文脈で自然言語の理解を可能にする方法を開発したいとしている。

SyntaxNet
https://github.com/tensorflow/models/tree/master/syntaxnet