NTTデータ、PostgreSQL向け全文検索ソフトをオープンソースで公開
NTTデータは2006年10月11日、同社が開発した全文検索エンジン「Ludia」(ルディア)をオープンソースソフトウェアとして公開した。オープンソースDBMS「PostgreSQL」に全文検索機能を追加する。ライセンスはGNU Lesser General Public License(LGPL)を採用した。
Ludiaは、PostgreSQLデータベース内に、テーブル内テキストデータに対する全文検索インデックスを作成することで、商用のデータベース管理ソフトに匹敵する高速・高精度な全文検索機能を可能にする。また、SQLと親和性が高く、扱いやすいインタフェースも特徴。
インデックス作成にはオープンソース全文検索エンジン「Senna」を利用。「N-gram」と「形態素解析」のインデックス主要2方式に対応する。また、検索方法も「ブーリアン検索」「近傍位置検索」「類似文書検索」の複数の検索に対応した。検索結果の合致度を示す「スコア」取得機能も備える。現在のバージョンは0.8。
NTTデータによると、商用データベースソフトには全文検索機能を持つものがあったが、オープンソースデータベースでは日本語に対応した高速・高精度な全文検索ソフトはなかったという。「Ludia」を使うことで、データを分散することなく一元管理を維持しながら全文検索機能の実装できるとしている。
ソースコードはSourceforge.jpで公開する。なお、「Ludia」とは欧州で初めてキリスト教に改宗した女性の名前で、これまでオープンソースが適用できなかった領域をオープンソース化したという意味で名付けた。【鴨沢 浅葱/Infostand】
NTTデータ
http://www.nttdata.co.jp/
Ludiaソースコード公開サイト
http://sourceforge.jp/projects/ludia/