Wikipedia創設者、Jimmy Wales氏の講演録:Wikimania 2007から
Wikiaについて
今日は、検索の未来についてお話をしたいと思います。その前にまずWikiaで何を行っているかについて総括したいと思います。
Wikiaのビジョンは世界で最大の持続可能なユーザーコントロールによるフリーコンテンツのメディア企業(world’s largest sustainable free content user control media company)になることです。持続可能とは、利益の出る方法を見つけなければいけないということです。人々を引っ張りソフトウェアを開発していき、長く維持していくということです。フリーコンテンツについては、なぜならば私はこの世界から来ているからです。私はフリーライセンスのコンテンツ、フリーオープンソフトウェアの考えを信じています。私はこれに人生の全てを注いでいます。そして、ユーザーコントロール。ウィキペディアで示されたとおり、コミュニティーが誠実なコントロールを行っており、フリーライセンスがそのための重要な役割を果たしています。
私が話した言葉で有名なものに「この惑星にいる誰もが、あらゆる知識全体にフリーにアクセスできることを想像してください」というものがあります。そしてWikiaは全ての人間の知識にフォーカスしています。それは単なる百科辞典を超えるものです。百科辞典がスタート地点であり、それがウィキペディアですが、図書館にはもっと多くのものが置かれています。私たちが考えているのは、ウィキペディア財団は、百科辞典、辞書、マニュアルなど非営利の文献を取扱い、Wikiaは、それ以外の本や雑誌、その他人類によって生みだされるあらゆるメディアを扱うということです。
すでにWikiaには様々なコンテンツが生まれてきており、現在3000以上のコミュニティーがあります。ウォークラフトや、ファイルナルファンタジーなどのゲーム、エンターテイメントの世界、テレビ番組のジャンルでは、とても複雑なシリーズである「24」や「LOST」についてのものがあります。こういった番組を何気なく観た視聴者は話がどうなっているのかを知ったり、ずっとあらすじを把握していくのは難しいのですが、そこでファンがあらすじがどうなっているのか、詳細をドキュメント化してくれます。で、私のようにたまたまLOSTを見た視聴者はLOSTで何が起こったのかわからないところがあると、LOSTのウィキをチェックして理解します。
なぜWikiaなのか。それは私がウィキペディアの創始者であるということから、ユーザーからの信頼があります。またスタッフは、様々な言語圏からのウィキペディアン(ウィキペディアユーザー)ですのでコミュニティーについての長い経験があり、自由とコントロールとの間で正しいバランスを取るために何が必要かについても熟知しています。ウィキをつかっているその他の会社もいろいろとありますが、ライセンスの取り扱いに問題があったり、不適切な検閲を行っていたり、コミュニティー自身に判断をさせていなかったりなどします。
ですが一番のポイントは巨大なコミュニティーを独自に創り出すのは難しいということです。大勢の人がMediaWikiをダウンロードし、ウィキを立ち上げていますが、コミュニティーを創造し、維持し、その熱を保ち続けるのは非常に大変なことです。いくつかの独自に立ちあがっていたウィキがWikiaにファミリーとして加わったのですが、それらのウィキではトラフィックとユーザーの参加が急増しました。シングルサインオンによる利便性もありますし、また関連する他のトピックから誘導できるからです。ウィキコミュニティーを独自に始めたときは、運営し続けていくのに苦労するでしょうが、Wikiaでコミュニティーを始めることで、すぐに似たような興味を持つ人たちが参加してくるのです。
そして私たちが考え続けているのは、このウィキのムーブメントをどのようにしたらギーク文化以外にも広げることができるか?ということです。どのような人たちがウィキペディアをつくっているのかと言えば、それはギークと呼ばれるような人たちです。これを次のグループへと広げていきたいと考えています。複雑なソフトウェアの使い方を学ぶ時間がない人に、できるだけ簡単な方法を提供したいと考えています。Wikiaは今までのところ、とても良い勢いで成長してきています。Wikiaの記事数は現在、フランス語、日本語、ポーランド語のウィキペディアを越え、2番目に大きいドイツ語のウィキペディアよりも成長しています。
それでは、WikiaのCEO、Gil Penchinaを紹介したいと思います。彼はWikiaの特徴についてデモンストレーションを行います。GilはeBayからやってきました。彼はヨーロッパのeBayの元トップで、コミュニティーに関する本物のセンスを持っています。eBayには何百万ものユーザーがいますが、eBayにとって本当に大切なのはコアとなるユーザー、実際にeBayを創り出している人たち、商品を出品している人たちです。それはWikiaでも同じです。何百万人もの人がWikiaを読んでいますが、最も重要なユーザーはWikiaを書いている人たちです。それでは、Gilのデモです。
…中略(Gil氏によるWikiaのデモンストレーション)…
オープンソース検索エンジンの必要性
さて、もう一つ野心的なプロジェクトがあります。それはフリーアクセス、検索エンジンプロジェクトです。昨年の12月末にWikia Searchについて世界中から多くの注目が集まりました。そして混乱も多くありました。Wikiaはウィキペディアとは完全に別の組織です。
さてWikia Searchの基本的なコンセプトですが、インターネット業界の構造について少し考えてみてください。もしオープンソースソフトウェアが存在しなければウェブサイトを構築するのに500万、1000万ドルかかってしまうかもしれません。オープンソースソフトウェア以外に頼らなければならないとしたらとても高くつくことになります。例えば、Apacheがなかったとしたら今日、インターネットはどうなっていたかを想像してみてください。ウェブにアクセスするための基本的なプラットフォームが完全にコントロールされていたとしたら……。
以前、AOLやCompuserveといったクローズドなオンラインンサービスがあり、大勢の人はそれらの中で最も速く大きなサービスになったものが市場を独占すると考えていました。ネットワーク効果によってです。もしも他の誰もがAOLに入っていたとしたら、他の人にアクセスするためにあなたもAOLに入会しなくてはいけません。私たちはとてもラッキーでした。当時存在していたこの問題は回避され、様々な企業がこの特別な時期にインターネットに携わり、その結果1社によってコントロールされていないオープンなプラットフォームが存在します。その大きな要素がオープンソースソフトウェアです。Linux、Apache、PHP、MySQL、これらのツール全てによって、人々がとても安くウェブサイトを構築できるようになりました。それによって、イノベーションの爆発が起こり、多くの情報がインターネット上を流れ、誰でもウェブサイトを簡単に始めることができ、言語を学び、新しいものを作ることができ、面白いものが生まれてくるのを目にしています。
同じようなことが百科事典の世界でも言えます。百科事典は、少数の重要な人によってコントロールされ、その結果とても高価なものでした。オープンソースのツールと、そのようなアイディアによってウィキペディアが生まれました。ご存じのとおり、フリーライセンスでオープンな百科事典です。
ですから私の考えは、同じことが検索においても言えないか?ということです。検索には今、次のような問題があります。検索にはメジャーなプレイヤーがいて、どのように運用しており、どのように情報を評価しているかは全て秘密です。私はそれは正しいとは思いません。ですからこの検索エンジンのプロジェクトは、インターネットがどのようにあるべきかという政治的メッセージが含まれています。Googleで検索をし、検索結果が返ってきますが、それがどのように評価されているのかはわかりません。私はそれが問題だと考えています。これはインターネットにおいて私たち全員がすぐに考慮しなければいけない社会問題です。
ですから私の提案は、完全に透明で、民主的にコントロールされたフリーオープンソースソフトェアの検索エンジンを作ることです。基本的な考えはLAMPを例にとって考えることです。LAMPと同じような考え方を検索エンジン業界に適用します。高品質な検索エンジンを構築するために必要な全てのパズルのピースについて考え、それらを分解し、それぞれが確実にフリーで、解析できるようにし、それぞれがコミュニケーションできるようにプロトコルを持たせます。検索結果を手にしたときに、それがどのように計算されて出たのかを分かるようにします。検索をしたときに結果をみて、それがどのような計算によって出ているかは、ほとんどの人は調べたりしないでしょう。ですが、調べることができるということが大事なのです。それは私たちが法律がどのように制定されているのか、どのように裁判の判決が下されているのかを知ることができるのと一緒です。たとえ毎日私たちが調べないとしても、それが出来ることが保証されているのが大事なのです。なぜなら何人かの人はそれを行うからです。
ウェブのクローリングも一般の人が使えるようにしたいと考えています。これはインフラ構築の一部です。もしもあなたが若く才能のあるプログラマで、新しい優れた検索エンジンを作るための素晴らしいアイディアを持っていたとしたら、自分だけでもいくらかコーディングが出来るでしょうが、ウェブをクロールするのはとても大変なことでしょう。それは巨大なインフラが必要な大プロジェクトです。ですから私たちは、人々がそれをフリーライセンスで使えるようにしたいのです。それによって私たちはマーケットの構造を急速に変えることができます。
オープンソース検索エンジンについて興味深いのは、そのようなプロジェクトはこれまで何度かあったのですが、誰もそれを保つことは出来ませんでした。砂の上に旗を立てて、「これが私たちがやることだ。これには助けが必要で、いろいろな組織と多くの人の働きが必要だ」と言ってきたのですが、今、私がその上に立って「これがやらなければいけないことなんです。これをしましょう」と言いたいと思います。
オープンソース検索エンジンの要件と取り組み
現在、search.wikia.comというページを設けています。これはSearch Wikia Labsのページです。人々が議論しアイディアを形成し始めるウィキですが、いまここのメーリングリストがより重要になっています。毎日新しい開発者が様々なオープンソースソフトウェアプロジェクトから参加してきて「何か助けたいんだけれど」とメールを送ってきています。そこで、メーリングリストに参加してもらい、話を始めています。そこで、Jeremie Millerとも話しています。
Jeremie MillerはJabberの創設者です。Jabberはオープンソースのインスタントメッセージングプロトコルです。私たちは彼が世界のオープンソース開発者のトップ20に入る人だと考えています。彼はとても素晴らしい人物で、誰もが彼を愛しており、オープンソフトウェア業界のキーパーソンは誰もがJeremieを知っています。彼はXMPPメッセージングプロトコルを開発し、最も重要なのは彼がオープンさと民主的なコントロールという私の哲学を共有していることです。ですから彼とプロジェクトについて話すために一緒に座ったときに、彼に私たちがどのように仕事をしたいか、どのように仕事をしなければいけないかを絶えず話す必要はありませんでした。彼はすでにそれを知っており、参加するのに完璧な一人でした。私がこのアイディアを発表したときに、彼は最初にアプローチしてきた人の一人だったんです。その前に一度も会ったことはなかったんですよ。
ですから私たちはメーリングリストで、「このプロジェクトがどうあるべきか」という基本的な原則について話し合ってきました。最初の原則は、透明性です。システムとアルゴリズムがどのように機能しているかについてオープンソースラインセンスであり、オープンなコンテンツであるという二つです。人々がシステム全体と様々な方法で相互作用できるようにします。
二つめの原則はコラボレーションです。これは全員が何らかの方法で貢献することができるということです。個人としてであろうと組織としてであろうとです。コミュニティーとソーシャルにフォーカスします。ある人はプログラミングで参加し、モジュールの拡張を追加し、別の人はコミュニティーがどのサイトをスパムサイトと判断するべきかの手助けをしたりなどします。
クオリティーはもう一つの原則です。このプロジェクトはとても大きな夢であり、楽しくエキサイティングなアイディアですがクオリティーは、検索エンジンと同じようにウィキペディアにとっても非常に重要です。ウィキペディアに載っている内容がゴミのようなものだったら成功していなかったでしょう。同じことが検索エンジンについてもいえます。検索をした結果がゴミだらけだったら、それは失敗でしょう。ですから品質はとても重要です。
それからプライバシーがあります。これはとても重要で達成するのがとても難しいものです。人々がサイトを使って情報を共有しているのはプライベートではありません。ウィキを書くのはプライベートとして行っていることではありませんが、検索をしているときは、その人が何を探しているかについては知られたくないものです。例えば、ウィキペディアでは何が追加されたか、あなたがどう貢献しているかは全て見ることができます。ですが、それはあなたのパブリックな活動です。私はあなたが何を読んでいるかは見ることができません。他の人がそれを読んでいるのを知ったら動揺してしまうものを読んでいるのかもしれません。ですからこれが達成しなければいけないバランスです。どのようなプライバシーのニーズがあるか、そしてそれをコントロールするためにどのようなツールを提供するか、どの情報を公開し、公開しないかをユーザーが選択できるようにします。
さて、つい最近、私たちはGrubを買収しました。これはウェブをクロールするプロジェクトです。このプロジェクトの歴史はとても面白いものです。2000年にオープンソースプロジェクトとしてウェブをクロールするシステムを開発し、それを配布するために始まりました。ですが、継続して改善が行われていったものの、不幸にも著作権を有するやり方でそれがなされていったのです。そのため参加している人はどんどんと減っていきました。最終的には、それは使われなくなりました。ですが、このツールの開発者はまだ情熱を持っており、私たちが買収して、再びオープンソースとなり、パブリックなプロジェクトになったことを喜んでいます。これはもちろんフルスケールの検索エンジンを作るプロジェクトのごく一部です。これはウェブ全体をクロールするツールの一つです。
最後に、私たちが必要な助けについて話したいと思います。ウィキペディアンは他の誰よりもウィキによる社会的協業を良く理解しています。多くの人がこのプロジェクトを最初聞いたときに、「スパマーがシステムを滅茶苦茶くにしてしまうから、そんなことできないよ」と言いました。「どうやってコミュニティーが物事を正しくもっていくのを信頼できるの?」と。でも、私たちは、ウィキペディアンは、それをどうやって行うのかを知っています。コミュニティーが正しくコントロールを行い、スパマーを防ぐための私たちが使っている多くのテクニックとツールがあります。ユーザーをブロックしたり、ふるいにかけたりすることによってです。この領域に必要とされる新しいツールがあります。私たちがソーシャルウェブサイトを立ち上げれば、多くの人が何が起こっているのかを経験し、分析するのを助け、フリーライセンスの高品質な検索エンジンというゴールが、悪い人の手に陥らずに存在していくことを望んでいます。
さて、幾つか哲学的な質問があります。私たちの編集ポリシーに関する深い知識によって、コミュニティーによって成される決断により、よりよい方法で回答することができます。検索結果はどう出すのか? 公平さをどう判断するのか? どのサイトが結果として出るべきなのか? どのように質を判定するのか? 私たちはこの問題が複雑なことを知っていますし、ウィキペディアの中で議論してきました。これはウィキペディアンが助けることができる課題です。
URLの管理はどうするか。私が最初にプロジェクトを発表したときに多くの人が誤解しているのが、「検索結果を表示するのにWikiを使うの? 途方もない労力が必要だし、決して終わらないよ。」というものでした。もちろん、その通りです。それは絶対に終わりません。これは18億の記事がある百科事典ではなく、事実上無数のページが存在するインターネットです。ですが、URLの管理のためにツールが必要であり、UIについて考える必要があります。いくつかのクリックと、いくつかのコマンドで検索エンジンのスパイダーのプロセスを便利に手軽に指示できるようにです。
そして最後に皆さんができる単純なことは、Grubをダウンロードすることです。ちょうどオープンソースクライアントとしてリリースしたところです。残念なことにこれは以前、著作権があるプロジェクトであったため現在はウィンドウズ版だけで、Linux版はとても古いのがあるのみです。ですが、今はオープンソースとなっています。ソースコードが入手可能です。もしもあなたがプログラマならば、それを見てどのように動いているのかを調べ、それを改善することができます。もしもそれをダウンロードしたならば、テストモードで動かしてください。すると私たちがウェブをクロールするのを助けて頂いていることになります。
以上がJimmy Wales氏の講演の内容だ。ウィキペディアは日本でもよく知られているサイトだが、海外での展開も目覚ましく、ウィキペディアを活用した大学講座、Wikiversityといった構想も動き出している。そしてWikiaについては日本ではまだそれほど話題にはなっていないが、非常に興味深い取り組みといえるだろう。特にオープンソースの検索エンジン、そしてそのパーツとしてのオープンソースのクローリングツールの展開は目が離せなくなりそうである。今後の同氏の生み出す動きに期待したい。