顔検出に深層学習を採用した「digiKam 7」が公開

 オープンソースの写真編集・管理アプリケーション「digiKam」開発チームは7月19日、最新のメジャーリリースとなる「digiKam 7.0.0」公開を発表した。

 digiKamはオープンソースの写真管理アプリケーション。Linuxのほか、macOS、Windowsでも動き、写真とRAW画像のインポート、管理、編集、共有などができる。

 digiKam 7.0は、2019年2月に公開されたバージョン6系に続く最新のメジャーリリースとなる。

 多数の機能強化の中でも最大の強化といえるのが、画像の顔管理機能。バージョン2.0で導入した顔検出機能はOpenCVライブラリのCascade Classifierをベースとし、深層学習を利用したものではなかった。そのため、顔管理のワークフローの自動化という点で不十分だった。今回、OpenCVライブラリのDeep Neural Networkをベースとしたコードを導入、顔管理向け事前学習データモデルを持ち、顔検出と認識をすぐに利用できるとしている。偽陽性は97%で、犬など人間以外の顔検出も可能。ランタイムの速度なども改善するという。

 RAW画像のサポートでは、libraw 0.20をベースとすることでCanon CR3、Sony A7R4など40以上の新しいフォーマットを使用できるようになった。バージョン6.4でサポートしたAppleのHEIFファイルフォーマットも改善した。

 Qtはバージョン5.15となり、全てのバイナリバンドルはQt 5.14.2 LTSに移行した。FlatPakのサポートが安定扱いとなった。

 このほか、外部機能プラグインとしてImageMosaicWallを導入した。SlideShowツールをプラグインとして移植し、画像をシャッフルモードで再生する設定も導入した。メタデータ管理でも位置情報をメタデータに書き込む機能などが加わった。

digiKam
https://www.digikam.org