Wikiスパムに対抗する

Wikiを開設しっぱなしにしてはいないだろうか。もしそうなら、覗いてみた方がよい。この1年ほど、スパムに利用されるWiki類が増えているのだ。Wikiを全くの無防備状態に置くか、逆に、全く自由度なしにしてしまうか。Wikiの開発者やWikiを運営する者にとって、この両極端のどの辺りを歩むべきなのか、悩ましい問題である。果たして、Wikiコミュニティは、オープンで使いやすいWikiを維持しつつ、スパムを撲滅できるのだろうか。

Wikiを対象とするスパムは、通常、ユーザー・プロファイルや練習用の領域といった標準ページに一群のリンクを挿入する。リンクが張られているテキストは、大概、たわいのないものだが、そこに指定されているURLはフィッシングやギャンブルやポルノのサイトのものだ。そうしたスパムページを数百あるいは数千作ることで、Wikiスパマーは、人々のクリックを誘うリンクを大量に作り、検索サイトで自分のサイトを高くランクさせるのである。

通報のあったWikiスパム一覧や既知のWikiスパム名の検索を見ると、この問題が拡大しつつあることがわかる。

こうしたスパムに対して、Wikiコミュニティはかねてから真剣に取り組んできた。これまでのWikiの理念は自主管理であり、コミュニティによって編集されることによって時間の経過とともに誤りは削除されたり訂正されたりしていくものと期待されていた。しかし、今では、そうした理念は成り立ちそうもない。Wikiへの投稿が人目に付くには、しばらく時間がかかるからだ。無人ないしそれに近い形で運用されている「幽霊Wiki」の場合は特にそうだ。そして、誰かが気づいたとしても、Wikiは通常履歴を残すため、問題のページを削除しただけではスパムを一掃することができない。さらに、人気のあるWikiでさえも、事を複雑にする事情がある。つまり、投稿の多くが偽りであり魅力のない危険なサイトへのリンクであれば、Wikiに参加しようとする真っ当なユーザーが減り、スパムに気づき削除しようとする人が少なくなってしまうのだ。

スパマーがWikiに集まってくる要因は他にもある。Wikiへの登録と投稿の手順は、できる限りわかりやすく単純である必要がある。そうでなければ、真っ当なユーザーは面倒くさくなって、逃げてしまうだろう。Wikiの持つその最大の特徴が、皮肉なことに、最大の弱点になっているのだ。Wikiのオープン性と容易に修正できるという特徴が、無責任な犯罪者が偽りの内容を書き込むことを許し、共有リソースの価値を低下させているのである。

それでは、対策はあるのだろうか。まず、「WikiスパムはWiki全体の問題であり、Wiki全体で解決する必要がある」。この点では、コミュニティは一致しているようだ。また、Wikiスパム問題は、電子メールやブログコメントのスパム対策で採用されているアプローチで解決することはできない。電子メールやブログには必ず通過する場所があるが、Wikiにはそうした隘路はないからだ。コミュニティという要素も考慮しなければならない――ベイズ・フィルターやグレー・リスティングやブラックリストといった方法は適用できないのだ。あるツールを採用するにしても、コミュニティは多様、それも極めて多様であり、ツールの利用と悪用がコミュニティに与える影響を考慮しなければならない。たとえば、ブラックリストを載せたWikiページを作り、WikiメンバーがブラックハットIPを提供できるようにして、コミュニティの支援を募ったとしよう。たまたまフレーム戦争のさなかにいる人が、このツールを利用して相手に報復するのをどうやって止めることができるだろうか。

今すぐにできることは幾つかあるだろうが、ツールを総動員して有効性を探るのが、現状、最善の策だろう。現行のツールは、次の3種に大別できる。

  • スパム行為を阻止するツール:行動に基づくバンリスト、ブラックリスト、ホワイトリスト、短時間に投稿を繰り返すなどのスパム様の行動にマークを付ける仕組み、スパム様投稿を抽出するための内容分析。この目的にSpamassasinが使えないかと検討されている。
  • ユーザーの検証:CAPTCHA(Completely Automated Public Turing Test to Tell Computers and Humans Apart)は、あるテキストのイメージを生成してユーザーに示し、そのテキストを回答するよう求める。回答しなければユーザーは先に進めない。これを利用すれば、自動処理のスパムを阻止することができる。スパム行為が人手によるものだけになれば、スパムの発生頻度は人間が入力できる程度に低下することになる。さらに、電子メールの検証手順と既知のスパムドメインを列挙したブラックリストを組み合わせれば、人間が行うスパム行為を抑えることができるだろう。
  • 事後対策:スパムページを探し削除する、スパマーに関する情報をコミュニティに提供する、悪用した者が属するISPに対処を要請する、不法あるいは不適切な利用を公表する。ChongquedというWikiは、面白い方法を採用し、スパムと戦うよう呼びかけている。Wikiで、既知のスパム・キーワードがchongqed.orgサイトにリンクするよう奨励しているのだ。これが積み重なれば、検索しても、現れるのはスパムで意図されたサイトではなく、chongqed.orgということになる。Chongquedは、Wikiスパムにリンクを持つサイトのリストも作成している。

それでは、Wikiにスパムを見つけたらどうすべきだろうか(もちろん、スパムを削除した後の話だ)。

  • お使いのWikiに関するサポートサイトや開発サイトで、Wikiスパムの適切な対策法に関する情報を探す。先週、スパムボットが私の管理するTwikiというWikiを襲い、盗んだIDを使って登録してスパムと中国のフィッシング・サイトへのリンクを多数作成した。そこで、私はTwikiのサイトを調べ、Wikiスパムの話題というページでTwiki用ブラックリスト・プラグインを見つけてインストールした。そして、問題のIPアドレスを追加したのだが、それ以降、スパムは見ていない。もっとも、これでお楽しみが終わったわけではもちろんない。
  • Googleは、ハイパーリンクに「nofollow」属性を付けて、コメントをスパムに利用しても役に立たなくするよう推奨している。この方法はスパマーがWikiのトピックに挿入したリンクにも有効で、Twiki Blacklistプラグインにも含まれている。
  • 使われていないゴーストWikiがあったら、停止することを検討する。評価用のものであれば、メインディレクトリに.htaccessログインなど、スパマーのアクセスを阻止する仕組みを導入する。

当然のことだが、Wikiスパムの悪行やそれに対する対策を論じるWikiページが数多ある。私もそのためのページを作ったし、Chongquedにもよくできた参考資料一覧がある。また、Meatball Wikiには、背景や定義を含む、かなりよく書かれた解説がある。

Wikiの世界ではありがちなことだが、対スパム戦の議論でも意見は千差万別であり、誰もが自説に固執する傾向がある。したがって、疑問点に適切な助言を得るには手間がかかるだろうが、忍耐を忘れてはならない。言葉は過剰ぎみでも技術はあり、自身の努力とコミュニティを悪用から保護しようという者が多数いるのだ。

幸いにも、ほとんどのWikiスパマーの行動は緻密さに欠け、容易に追及して阻止することができる。しかし、Wikiスパマーも急速に巧妙になり、電子メールのスパマーと同様の技法を用いてブラックリストなどの現行の阻止技術を回避するようになるだろう。そうなれば、現行のツールを改善し、あるいはさらに複雑なツールを開発しなければならないだろう。

残念なことだが、当分の間は、決定的な勝利の日が来ることは望めないだろう。素早い行動、コミュニティ・サポートの活用、速やかな連絡。これにより、Wikiスパマーから新たな戦いを挑まれるたびに撃退することが、望みうる最善の形である。

原文