コミュニティの力でGoogleとYahooに挑むWikia Search

 昨日(1月7日)、フリーソフトウェアとフリーカルチャーの価値を活かして構築された新たな検索エンジン、Wikia Searchのアルファリリース版が公開された。Wikiaの共同設立者Jimmy Wales氏にとって、今回のリリースは長らく抱いてきた夢の実現に向けたマイルストーンの1つだった。しかし、同氏がLinux.comに語ったように、Wikia Searchは形になってまだ2年、取り組むべき細かな問題が数多く残っている。

 「思想的な面では、フリーソフトウェアを大いに支持している。だが、私の興味はずっと以前から効率的かつ透明性を備えた検索エンジンにある」とWales氏は話す。分散型WebクローラのGrub(昨年夏にWikiaが買収、その後すぐにソースコードが公開された)など、Wikia Searchを支えるフリーソフトウェア・テクノロジだけでなく、「編集上の決定が必要になるあらゆる時点で、そうした決定を社外そしてコミュニティに公表していきたい」というのがWales氏の決意である。

 Wales氏は、利用者の検索にも使えるソーシャルネットワーキングのプロファイル、曖昧性解消のような機能、それに画像や定義など“コミュニティが役に立つと考えるあらゆるもの”を提示するためのミニアーティクル、検索結果別の5段階評価、コミュニティの活動によって検索結果の質を高めるためのホワイトリストおよびブラックリストといった機能について話してくれた。今回のアルファリリースで実装されているのはこれらの機能の一部だけだが(囲み記事を参照)、彼は興奮した口調で語った(この検索エンジンに携わるようになってからは、同じことを何度もあちこちで話しているはずなのだが)。

 「これは新たな検索エンジンを作り出すプロジェクトだ」とWales氏は飾らずに言う。

初日のWikia Search利用結果
 Wikia Searchは、Googleのような著名な検索エンジンを普通に使っている人ならだれにでもすぐ使えるはずだ。検索項目の入力フィールドは1つだけで、詳細検索用のボタンはない。ただし、この入力フィールドではGoogleと同様の詳細検索が行える。たとえば、フレーズを引用符で囲んで入力したフレーズそのままで検索をかけたり、キーワードの前にマイナス記号を付けてそのキーワードを含むページを検索結果から除外したりできる。

 また、検索結果の各リストの最上部には、定義、イメージなど補足的な結果を提示するミニアーティクルが表示される。検索結果のリンクは1ページに10件ずつ表示され、ボタンを押すと次の10件が表示される。それぞれの検索結果にはキャッシュ版へのリンクも表示されるが、このリンクは昨日の朝の段階ではまだ機能していなかった(この時点ではおそらくページの収集が一度しかされていないはずなので、キャッシュ版が存在しないのは当然かもしれない)。

 だが、Googleの代わりとして使えるものを期待している人は不満を感じるはずだ。共同設立者のJimmy Wales氏は「公開初日の時点だと、収集済みURLは5000万~1億ほどに留まるだろう」と語っていたが、確かに検索のヒット数は少ない。たとえば”Free Software Foundation”で通常の検索をかけたところ、Wikia Searchのヒット件数が3,969なのに対し、Googleのそれは7,220,000件である。

 今のところ、Wikia Searchの魅力は検索結果ではなく、付加機能のほうにある。検索結果にマウスカーソルを置くと、そのページに対する5段階評価が表示される。この評価は数値でも表示されており、クリックすると評価値の計算過程が参照できる。この評価方法は単独で見るだけでは不可解だが、別の結果と比較すればその計算の仕組みがわかってくるはずだ。

 検索結果のページの右側にもWikia Searchの特徴が表れている。そこには、Wikiaのソーシャルネットワーキング形式のプロファイルを活用した利用者のマッチング機能、良質なサイトの上位10件、50件、100件をまとめた編集可能なホワイトリスト(Wikiaコミュニティによるもの、ない場合もある)、検索エンジンVisvo(検索インデックスをWikia Searchと共有しているらしい)へのリンクが存在する。

 現状、付加機能はそれほど多くないが、Wikia Searchの効用を知るには十分といえるだろう。最初から検索結果の順位評価方法がわかっているので、検索エンジン最適化についてはノウハウや技よりも数学的なアプローチが効いてくる。だが本当の問題は、Wikia Searchの検索件数がGoogleやYahooに追いつくまで、これらの機能によって利用者をつなぎ止めることができるかどうかだ。

経緯と影響

 こうした思想的背景にも関わらず、Wikia Searchは頭の堅いビジネス関係者からも支持されている。Wikia(Wikipediaとは直接的な関わりはなく、広報担当者はその周知に苦心している)の1プロジェクトであるWikia Searchが初めて発表されたのは13カ月前のことだ。このプロジェクトはAmazon.comとBessemer Venture Partnersから400万ドルずつの出資を受けており、2006年にスポーツを対象としたWikiであるArmchairGMを、2007年7月に分散型検索エンジンのGrubをそれぞれ買収したことで開発が加速した(Grubについては買収直後にコードを公開)。同様に重要なのは、一般に語られていない想定がこのプロジェクトの背景にあることだ。それは、コミュニティを利用した機能によって、GoogleやYahooのような老舗の勢力に対抗しうるところまでWikia Searchのインターネット検索の質を高められる、というものである。

 厳密にいうとWikia Searchは、利用者が興味のある分野の記事を執筆しているWikiaコミュニティとは独立した存在だ(Wikiaのこのやり方は、Wales氏の名を知らしめたWikipediaプロジェクトにならったもの)。しかし、Wikia Searchの検索エンジンはWikiaサイトとログイン画面が共通であり、少なくとも今のところは、検索結果の上位にWikiaコミュニティによって書かれた記事が多数並んでいる。現在Wikiaには約4,000のコミュニティが存在するが、Wales氏は「メンバーの多くが検索のコミュニティに関与している可能性がある。まだはっきりとしたことはわからないが」と述べている。

 Wales氏のアイデアの発展には、Open Directory Project(ODP)の開発が大きな役割を果たしたという。「Open Directory Projectも同様のコンセプトで開始された。しかし残念ながら、このプロジェクトはAOLに買収されてからあまり顧みられなくなった」。彼はODPの問題について次のように話す。「スパムや編集上の問題に直面した際、ODPは誰もが当たり前と思うような対応をしたため、非常に閉鎖的かつ偏狭なコミュニティになってしまった。今や参加するのは非常に困難だ」

 一方でWales氏はこう語っている。「Wikipediaは、すべてをオープンにして透明性を確保する別の方法が存在することを示した。編集過程における人々のあらゆる動きを参照できるようになっているのは、コミュニティによる詳しい調査を可能にし、不正を行った者を遠ざけたりアクセスを禁じたりすることができるようにするためだ」

今後の展望

 ニュースリリースには、Wikia Searchが注力している点として透明性、コミュニティ、品質、プライバシーという4つの原則が記されている。これらの多くは、すでにアルファリリース版に見ることができる(ユーザプロファイルにおける3階層のプライバシー設定など)。

 しかし、細かい点の多くは今なお進化の途上にある。おそらく最も遅れているのが評価システムだろう。この機能は、検索の品質を保証する主要な基準の1つと考えられている。「我々は、最初からこの機能をきわめてオープンエンドなものと捉えている」とWales氏は述べる。「ユーザに評価を行ってもらい、我々はその情報を検索結果の改善のためにフィードバックしようと考えている。だが、我々はまだその方法を知らない。評価データがどのようなものになるかわからないからだ。だが、一度データを流してみれば、別のアルゴリズムやデータを参照する別の方法を試すことができるだろう」

 「研究者やハッカー、そのほかユーザによる評価データを質の高い検索結果に反映させる方法に取り組みたいと思う人ならだれでも、プロジェクトに引き込みたいところだ」とWales氏は語る。1つの可能性として彼が考えているのは、信頼できる関係者のネットワークを構築することで検索結果を確保し、ログインメンバーが受け取った結果を彼らの友人によるコメントに従って修正するという方法だ。

 そうした詳細な部分がたった一夜にして動き出すことはないだろう。現在、Wikia Searchのフロントページには、検索結果の質が低いことが明記されている。Wales氏は「(Wikia Searchの検索結果が)業界の水準に達するには少なくともあと2年かかるだろう」と言う。

 あくまでも、Wales氏は長期的な視野でこのプロジェクトを進めている。検索エンジンを支配する二大勢力に真っ向から挑むようなプロジェクトに取り組むのはなぜか、と訊かれてWales氏はこう答えた。「なぜかって? Linuxサイトの関係者なら、その答えを知っているはずだ。では訊くが“Microsoftは巨大な力を持つ存在だ。にもかかわらず、オープンソースに肩入れして時間を浪費しているのはなぜかね”。それは愉快だからだ。それが答えさ」

Bruce Byfieldは、Linux.comとIT Manager’s Journalに定期的に寄稿しているコンピュータジャーナリスト。

Linux.com 原文