Google、社内で利用するプライバシーに配慮した統計ツールをオープンソースで公開

 Googleは9月5日、「Differential Privacy(差分プライバシー)」ライブラリのオープンソース版を公開したことを発表した。個人を特定できる情報を除いてデータを収集して分析などに活用するのに用いる技術で、Google社内で利用しているという。

 個人情報や機密情報を含むデータセットを統計処理するためのもので、Googleの中核製品でプライバシーを保護しながらの情報分析に用いられているという。ライセンスはApache License 2.0。このライブラリを利用することで、個人を特定できる情報を明らかにすることなくデータの収集が可能となる。

 公開したのは「ϵ-差分プライバシ」アルゴリズムを実装したもので、よくあるデータサイエンスの運用のための機能としてCount、Sum、Mean、Variance、Standard deviationなどのアルゴリズムを含む。アルゴリズムの正確さをチェックする確率テスターも備えるほか、事前構築したアルゴリズムがカバーしない処理を行うためのラプラス(Laplace)メカニズムも提供する。すぐに利用できるように、PostgreSQL拡張なども用意している。

google/differential-privacy
https://github.com/google/differential-privacy/