セマンティックデスクトップの導入を図るNepomukとKDE

 テクノロジの動向に敏感な人なら、セマンティックデスクトップについて聞いたことがあるだろう。コンピュータ上の情報に注釈を付けたり共有したりするためのデータレイヤのことだ。だが、セマンティックデスクトップが遠い未来の話ではなく2008年末に登場予定であることは知らないかもしれない。その折には、Nepomukプロジェクトと、そして最初はおそらくKDEの成果を利用して、セマンティックデスクトップの構想が実現されることになるだろう。

 Deutsches Forschungszentrum für Künstliche Intelligenz(DFKI、ドイツ人工知能研究センター)のナレッジマネジメント部門の次長でNepomukの調整役を務めるAnsgar Bernardi氏は、「最近、我々が直面しているのは、どのようにして膨大な量の情報を実用的な速度で処理するか、という根本的な問題だ」と説明する。Nepomukでは従来型のアプローチをとっていて、うまく定義された要素を使ってメタデータレイヤを作成し、そうした情報の作成と操作を行うサービスをそのレイヤ上に構築できるようにしているという。

 「セマンティックデスクトップ構築の最初のアイデアは、友達の彼女を覚えられないという、ある同僚の体験から生まれた」とBernardi氏は冗談交じりに言う。「相手はころころ変わるからね。とにかく、デスクトップ上には大量の情報があり、ファイルや電子メールの中、それにフォルダの名前や構造にも情報が隠れている。Nepomukはそうした情報を普通の方法で扱えるようにするものだ」

 「概念的には決して新しいものではない」とBernardi氏は補足する。たとえば、オフィススイートには何年も前からセマンティックデスクトップの考え方が含まれており、一部のオフィススイートでは、メールで取ったアポイントメントを自動的に予定表に追加できるものがある。Nepomukでは、こうした関連性をすべてのファイルに拡大して、ユーザの目的に応じた情報の整理や操作をかなり柔軟な形で行えるところが異なる。

 「ユーザビリティと世間への影響という点で非常に興味深いものだ」と語るBernardi氏の言葉は、どちらかといえば控えめなものだ。

Nepomukプロジェクト

 Nepomukプロジェクトは、2006年にEU(European Union)から1150万ユーロの資金を受けて発足した。現在、Hewlett-Packard Galway、IBM、Edge-IT(Mandrivaの関係組織)など、16のパートナーを持つ。

 大まかにいうとNepomukには3つの側面がある、とBernardi氏は述べている。1つ目は、情報どうしを関連付ける注釈付けの標準フレームワーク。2つ目は、「文書化された共通の理解」(バイオサイエンスやコンピュータデスクトップ用途など、特定のタイプの情報に対して定義できる共通概念)の集合であるオントロジー。3つ目は、こうした注釈やオントロジーを作成または利用するためのツール群で、Bernardi氏はこれを「ほかの人のワークスペースとつながっていて、情報の収集、構造化、意味付け、新たな情報の作成と伝達といった日々の活動に役立つワークスペース」と説明している。

 これら3つの側面を揃えることで、あらゆるレベルのユーザに影響を与えられる。Nepomukをサポートしたデスクトップを初めて使うときには、注釈を追加する前に、データソースを選んでインデキシング(索引付け)を行う。また、少なくともNepomukの機能の一部は、Java検索エンジンLuceneに基づいたものになるだろう。

 セマンティックデスクトップを日常的に利用するユーザの場合、すでにBeagleのようなアプリケーションによって導入されている類の検索機能を強化できる。また、既存のどんなプログラムよりもユーザの管理できる範囲は広がる。大学の研究者など、高度な使い方をするユーザの場合、Nepomukはデータマイニングそのものを行うことはできなくても、そうした作業の支援に利用できる。たとえば、標準的な実験レポートを書いている研究者であれば、ファイルの注釈に基づいて情報の自動追加を行わせることで必要な情報の多くを集めることができるだろう。

 どんなレベルでNepomukを使おうとも必ずついて回るのが標準のセキュリティプロトコルで、Bernardi氏が「さまざまなレベル、暗号化、キー管理に対するパーミッション」と説明するこうしたプロトコルの大半は、情報共有のための管理および制御を明確化するものだ。Nepomukユーザは、どの個人情報が共有されているかを管理できるだけでなく、共通の視点、すなわち共有される注釈の作成も行える必要がある。これにより、たとえばセマンティックデスクトップに関する同様の研究を、受け手に合わせてだれかが情報を変更したりすることなく、人工知能研究者とWeb開発者の間で共有できるようになる。このセキュリティを使いやすいものにする、というBernardi氏の言葉には力がこもる。「でないと、だれにも使ってもらえないことになる」(Bernardi氏)

 Nepomukの抽象度の高いコンポーネントはさまざまなライセンスの下でリリースされるだろう、とBernardi氏は予想しているが、具体的にどのライセンスになるかは未定だ。基本的なフレームワークは、BSDライセンスまたはGPLの下でリリースされる可能性が高い。予定表の項目といった一部のオントロジーのリリースも何らかのフリーライセンスの下で行われるが、その他については、Nepomukのパートナーがいわゆる知的財産権を保護できるように、プロプライエタリなものになりそうだ。この点はNepomukのユーザインタフェースについても同様だろう。

 Nepomukのスケジュールでは、2008年末に開発完了となっている。Bernardi氏によれば、今のところプロジェクトは順調だという。6月にフィーチャーフリーズ(機能の凍結)を迎え、現在は統合テストが進められている。9月にはユーザテストが予定されており、ライセンスの決定はそのあとになる。

 プロジェクト完了後も、開発はいくつかの拠点で続けられる。研究で成功してDKFIからスピンオフした会社は20年間で40社を数えているので、Nepomukに関する会社も設立されそうだ。Nepomukに関与している組織の少なくとも一部は、自前で研究を続ける可能性が高く、KDEやSemanticDesktop.orgではオープンな開発が行われるだろう。そのほか、Semantic Desktop Foundation設立の話も持ち上がっている。

NepomukとKDE

 KDEとNepomukの橋渡し役となったSebastian Trüg氏は、定評のあるCD/DVDバーナK3bの開発者としてよく知られている。コンピュータサイエンスの学位を取ったあと、Trüg氏はKDE環境でのNepomukの実装に携わるためにEdge-ITに入社した。

 Nepomukの追加はKDE 4の重要な目標の1つだとTrüg氏は説明する。「KDEの4.0にもNepomukテクノロジは含まれているが、あまりユーザの目にはとまらないだろう。現時点ではタグ、ランク付け、コメント、あるいは検索高速化のためにファイルからキャッシュされたメタデータしか使えない。4.1でも、KDEの新しいファイルマネージャDolphinや画像ビューアGwenviewのようなアプリケーションに、タグ付けやランク付けのインタフェースが付くだけだ」

 しかしKDEは、それ以降のわずかなリリースのうちにNepomuk利用の大幅な拡大を予定している。「人々をファイル(写真など)やほかの人と関連付けたり、Webサイトのタグ付けを行ったりする実験的ツールはすでに存在する。しかし、今後は(Nepomukと)多くのアプリケーションとの組み合わせが想定される。重視されるのはもちろん、KMailやKAddressbookといったKDE PIMアプリケーションだ。たとえば、KMailの開発者はNepomukを利用した仮想メールフォルダ機能の提供を想定している。また、KDE PIMから連絡先を抽出してメールやIMアカウント、日付にリンクさせるサービスも考えられており、これによって知人に対する抽象ビューが得られる」(Trüg氏)

 Trüg氏は、こうした開発がうまくいった場合について次のように語る。「同じ人物のメールアドレスとIMアカウントであれば、両者の違いを気にせずに扱えるようになる。また、すべてのメールを検索しなくても、現在チャット中の相手からのメールを参照できるようになるだろう。さらに、その相手がさまざまなメールアドレス使ってメールを送信していた場合でも、Nepomukがそれらの違いを考慮してくれるはずだ」

 「頭の中には(私の頭だけではないが)アイデアがあふれているのだが、開発者の数が足りない」とTrüg氏は嘆く。彼はこの状況を変えるべく、Nepomuk指向のコードを書くための一連のチュートリアルを公開している。

セマンティックデスクトップの次はセマンティックWebか

 「Nepomukはすばらしいツールで、それ自体が完結している。きっとアプリケーション構築の新たな方法になるだろうし、我々もその成功を願っている」(Bernardi氏)

 しかし、Bernardi氏にとって最大の願いは、Nepomukによって個人用ファイルの利用法を変えることに加えて、論理的にはセマンティックデスクトップの次のレベルにあるセマンティックWebの実装を成功に導くことだ。

 現在、セマンティックWebは「鶏が先か卵が先かの問題」に直面している、とBernardi氏は説明する。セマンティックWebの構想は、インターネット上のすべての情報に注釈を付け、新しいレベルのサービスを生み出すことだ。しかし、だれもそうしたサービスを生み出してはいない。サービスを有用なものにする注釈が利用できないからだ。

 Nepomukがこのジレンマを解消する手だてとなることをBernardi氏は望んでいる。「Nepomukはきっと解決の手段になるだろう。Nepomukは情報の注釈付けを容易にする環境を備え、ユーザによる情報の管理に役立つからだ。これは、自分の情報に注釈を付ける個人的な動機付けになる。そして、すべてはそこから始まる」

 Nepomukが開発者の望むような重要な意味を持つことになるかどうかは、まだわからない。だが、2009年中にはその答えを知る機会が得られそうだ。

Bruce Byfieldは、Linux.comに定期的に寄稿しているコンピュータ分野のジャーナリスト。

Linux.com 原文