任意の幾何学的特徴の転写生成を可能にし、生成品質で世界最高精度を達成
生成AIを活用して産業DXに挑む株式会社データグリッド(本社:京都市左京区、代表取締役CEO:岡田 侑貴、以下「当社」)は、コンピュータービジョンの主要な国際会議の1つであるWACV 2025(IEEE/CVF Winter Conference on Applications of Computer Vision 2025)のメインカンファレンスに、当社が開発した画像生成AIに関する研究論文「Harmonizing Attention: Training-free Texture-aware Geometry Transfer」(以下、本論文)が採択されたことをお知らせいたします。
採択された本論文のプレプリントは、arXivにて公開しています:https://www.arxiv.org/abs/2408.10846
■ WACV2025について
IEEE/CVF が主催するWACV(https://wacv2025.thecvf.com/) は、毎年冬季に開催されているコンピュータービジョン分野の国際会議です。コンピュータービジョンに関する最新のアルゴリズムやアプリケーションなどに関する研究成果を共有する場として、世界中から各分野の専門家や研究者が集まります。WACV2025は、Round 1とRound 2の2段階の査読プロセスで構成されており、本論文はRound 1にて採択されました(採択率12.1%、1381本の投稿論文のうち167本がRound 1にて採択)。WACV2025は、2025年2月28日~3月4日にアリゾナ州・ツーソンにて開催される予定です。
■ 背景と研究成果
従来の拡散モデル等の生成モデルを活用した方法では幾何学的特徴を自然に転写生成することが困難という課題がありました。この課題を解決するため、本論文では、インペインティング用の事前学習済みの拡散モデルを活用した「Harmonizing Attention」という新しいアーキテクチャを提案しています。「Harmonizing Attention」では、拡散モデルのinversionプロセスと生成プロセスにおいてself-attention layerをカスタマイズすることで、テクスチャと幾何学的特徴を独立に抽出・生成することを可能にしています。このアーキテクチャにより、幾何学的特徴を従来の手法と比較して、自然に転写することに成功し、物体転写に関する主要な評価指標で世界最高精度(SOTA)を達成しました。
このHarmonizing Attentionアーキテクチャを含む生成AIは、すでに当社が提供する製造業向けAIデータ生成基盤「Anomaly Generator」に搭載されており、外観検査でNGデータ不足の課題を抱える多くのお客様に活用されております。
■『Anomaly Generator』について
Anomaly Generatorは、局所的生成技術に関する特許(特許第7398127号)と自社開発の生成AIアーキテクチャであるHarmonizing Attention(https://www.arxiv.org/abs/2408.10846)をベースに、製造業に特化した生成AIを活用し、少数の不良品データから多様な不良品データを網羅的に生成できるソフトウェアです。このソフトウェアによって、製造業を中心に外観検査システムを構築する上での不良品データ不足の課題を解決します。
Anomaly GeneratorサービスサイトURL: https://anomaly-generator.site/
■ データグリッドについて
データグリッドは、京都大学発AIベンチャーとして2017年の創業以来、一貫して生成AI技術をコアにした事業を展開しています。製造業を中心とする産業分野での生成AIのソフトウェアを提供し、データに関わる課題を解決することで、企業のDXを推進しています。
コーポレートサイト:https://datagrid.co.jp/
■ 本件に関するお問い合わせ先
株式会社データグリッド
TEL:075-286-4470
E-mail:info@datagrid.co.jp