全文検索ライブラリ「Apache Lucene 7.2」リリース

 全文検索ライブラリApache Luceneプロジェクトは12月21日、最新版となる「Apache Lucene 7.2」を公開した。サブプロジェクトのLuceneベースの検索プラットフォーム「Apache Solr」もバージョン7.2が公開となった。

 Apache LuceneはJavaで実装されたテキスト検索ライブラリ。毎時150GB以上という高性能で拡張性のあるインデックス処理が特徴で、さらにインクリメンタルなインデックスも同じぐらい高速に処理できるという。ワイルドカード検索、近接検索なども可能で、全文検索機能を必要とするアプリケーションで利用できる。

 Apache Lucene 7.2は、9月に公開されたバージョン7系の最新版。クエリスコアをValuesSourceでエクスポーズできるようになり、特定のクエリ実装をキャッシュからオプトアウトできるようになった。また、TopFieldDocCollectorでインデックスがソートされ、トータルのヒット数が必要とされない時にマッチコレクションを早期終了できるようになった。IndexWriter#flushNextBufferでは、IndexWriterのメモリ使用の細かな調整が可能になった。

 Luceneをベースとした検索プラットフォームSolrは、信頼性、拡張性、フォルトトーラレント設計などを特徴とする。分散インデックス、レプリケーション、負荷分散クエリなどの機能を持つ。

 7.2では、クロスデータセンターレプリケーション(CDCR)クラスタで双方向の同期をサポートした。スコアを改善する新たにsynonymQueryStyleフィールド型がオプションに加わった。また、正規表現にマッチした用語のみにファセットバケットを返すfacet.matchesパラメーターも加わった。

 このほか、自動拡張、ストリームの評価なども強化した。Apache Lucene、Apache SolrはプロジェクトのWebサイトより入手できる。

Apache Lucene
https://lucene.apache.org/core/

Apache Solr
http://lucene.apache.org/solr/