ユーザー参加型日本語入力システム「Social IME」がオープンソース化
ユーザー参加型日本語入力ソフトウェア「Social IME」の開発者であるnokuno氏が2010年3月13日、同ソフトをオープンソースソフトとして公開した。当初はサーバサイドの統計的かな漢字変換エンジンのみの公開で、動作にはGoogle N-gram相当のデータが必要。ライセンスはBSDライセンス。
Social IMEは、クライアント/サーバ形式の日本語入力システムで、ユーザが単語を登録すると共有辞書に追加され、すべてのユーザで共有できる。単語や正しい変換結果を覚えさせることで、賢くなっていく。
また、予測変換機能を備え、Webページの文章から単語の使用頻度などの統計量を抽出することで、よく使われる文章表現を候補にできる。当初はサーバーサイドだけの公開だが、クライアントサイドや古いバージョンも順次追加していきたいという。
nokuno氏は、これまで辞書やデータをサーバサイドに集約する基本設計はオープンソースとは相性が悪いと考えていたが、グーグルや百度などのWebデータに基づく統計的かな漢字変換ソフトのリリースで、辞書精度の高さが実証され、このことがオープンソース化を決めるきっかけになったとしている。
Social IMEは、慶應義塾大学理工学研究科修士課程の学生(当時)だったnokunoこと奥野陽氏が開発。2007年度の情報処理推進機構(IPA)未踏ソフトウェア創造事業に採択された。
Social IME
http://www.social-ime.com/
ソースコードのダウンロードページ
http://code.google.com/p/social-ime/
奥野陽氏のブログ
http://d.hatena.ne.jp/nokuno/