米Facebookが画像・動画マッチングアルゴリズムをオープンソースで公開

 米Facebookは8月1日、画像と動画マッチングのためのアルゴリズム2種類をオープンソースソフトウェアとして公開することを発表した。児童ポルノ、テロリストによるプロパガンダ、露骨な暴力表現などの識別に使うことができるという。

 Facebookが公開したアルゴリズムは写真マッチングアルゴリズムの「PDQ」と、動画マッチングアルゴリズムの「TMK(Temporal Match Kernel)+PDQF」。Facebook自身が有害なコンテンツを検出するのに用いているという。

 PDQは類似画像検出に使われるPerceptual Hash(pHash)アルゴリズムから着想を得て、独立したソフトウェア実装を持つ全く別のアルゴリズムとして土台から構築したもの。また、TMK+PDQFはArtificial Intelligence Researchチームとイタリアのモデナ・レッジョ・エミリア大学とが共同開発した。

 2つのファイルが同じまたは類似しているのかを決定できるハッシュ値を算出できるもので、オリジナルの動画や画像なしにハッシュ値だけで各種処理が行える。ハッシュ値の共有も容易だという。video-frame-hashingのサポートなどにより、拡張性のある形で運用できる点も特徴としている。

 Facebookはさまざまな技術をオープンソースにしているが、写真と動画マッチング技術をオープンソースにするのは初めて。オープンソースでコードを公開する狙いとして、業界のパートナー企業や個人開発者、非営利団体などがこの技術を使って有害なコンテンツを簡単に検出してハッシュ値(デジタルフィンガープリント)を共有することを促進できるとしている。この分野では米Microsoftが開発したPhotoDNA(児童ポルノ対策として画像の検出やレポートを行う技術)、米Googleの「Content Safety API」などがあり、業界全体の取り組みと位置付けている。

TMK
https://github.com/facebook/ThreatExchange/tree/master/hashing/tmk