米Yahoo!がポルノコンテンツのフィルタリングのためのCaffeベースのディープラーニングモデルを公開

 米Yahoo!は9月30日、ディープラーニング(深層学習)フレームワーク「Caffe」ベースのディープラーニングモデルをオープンソースとして公開した。ポルノなど不適切なコンテンツの分類に利用しているもので「open_nsfw」と名付けている。

 ユーザー生成コンテンツがインターネットを独占する中、ポルノなど職場閲覧不適切(NSFW:Not Suitable/Safe for Work)コンテンツは重大な問題で、Yahoo!社内でも研究者らが長年これらへの対処に取り組んできたという。コンピュータービジョン、データのトレーニングとディープラーニングアルゴリズムにより、コンピューターは自動でNSFWとされる画像を含むコンテンツをかなり高い精度でフィルタリングできるとしている。

 Yahoo!が公開したのは、汎用のディープニューラルネットワークフレームワーク「Caffe」をベースとし、CaffeをHadoopおよびSparkクラスタで利用できる分散学習向けのフレームワーク「CaffeOnSpark」を利用したモデル。これを利用して、画像を取り組み、NSFW画像の検出とフィルタリングに用いることができるスコアを0~1でつけることができる。

 開発者はこのスコアを利用して、特定のユースケース向けの受信者操作特性(ROC)曲線をベースに画像をフィルタリングできる。また検索結果のランキングにも利用できるという。

 コードはプロジェクトのWebサイトより入手できる。ライセンスは二条項BSDライセンス。

open_nsfw
https://github.com/yahoo/open_nsfw