Lucene 实战教程第十章使用 PerFieldAnalyzerWrapper 为不同字段指定不同分词器

从教程的第一篇到现在，大家可能会发现一个问题。那就是所有的 Document 文档或者 Field 字段都使用的是同一个分词器。那么有没有办法让不同的 Field 使用不同的分词器呢？

答案就是 PerFieldAnalyzerWrapper。这也是为什么我把它单独抽出来作为一章的原因。

如果一个文档需要多个分词器，可以这样做：

Analyzer analyzer = new StandardAnalyzer();
IndexWriter writer = new IndexWriter(direcotry, analyzer, true);
Document doc = new Document();
// 正常情况下
writer.addDocument(doc);
// 如果要新添加一个分词器，可以这样做，analyzer
writer.addDocument(doc, new KeywordAnalyzer());

如果是多个 Field，也可以分别为每一个 Field 指定分词器。做法如下：

PerFieldAnalyzerWrapper aWrapper = new PerFieldAnalyzerWrapper(new StandardAnalyzer()); 
aWrapper.addAnalyzer("cnname", new KeywordAnalyzer()); 
aWrapper.addAnalyzer("enname", new StandardAnalyzer());

需要注意的是：在索引阶段，对应字段使用了什么分词器，同样的在检索阶段，也必须这样处理，否则无法检索到结果。

Lucene 实战教程第十章使用 PerFieldAnalyzerWrapper 为不同字段指定不同分词器

： » Lucene 实战教程第十章使用 PerFieldAnalyzerWrapper 为不同字段指定不同分词器

原创文章，作者：端木书台，如若转载，请注明出处：https://blog.ytso.com/251966.html

Lucene 实战教程第十章使用 PerFieldAnalyzerWrapper 为不同字段指定不同分词器

相关推荐

发表回复