基于前一章的内容,我们对 Lucene 有了一个大概的了解,本文来一个 Hello World 程序!让我们从此开启 Lucene 的学习模式。
首先,我们新建一个 Maven 项目,然后在 pom.xml 中配置以下内容:
<dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-core</artifactId> </dependency> <dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-analyzers-common</artifactId> </dependency> <dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-queryparser</artifactId> </dependency> <dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-highlighter</artifactId> </dependency> <dependency> <groupId>org.wltea.analyzer</groupId> <artifactId>ikanalyzer</artifactId> </dependency>
然后编写一个测试的 LuceneHelloWorld 类。
public static void main(String[] args) { //构建IK分词器,使用smart分词模式 Analyzer analyzer = new IKAnalyzer(true); //获取Lucene的TokenStream对象 TokenStream ts = null; try { ts= analyzer.tokenStream("xttblogfield",new StringReader("网站:www.xttblog.com," + "公众号:(yyucao)!IKAnalyer can analysis english text too")); //获取词元位置属性 OffsetAttribute offset = ts.addAttribute(OffsetAttribute.class); //获取词元文本属性 CharTermAttribute term = ts.addAttribute(CharTermAttribute.class); //获取词元文本属性 TypeAttribute type = ts.addAttribute(TypeAttribute.class); //重置TokenStream(重置StringReader) ts.reset(); //迭代获取分词结果 while (ts.incrementToken()) { System.out.println(offset.startOffset()+" - "+ offset.endOffset() +" : " + term.toString() + " | " + type.type()); } //关闭TokenStream(关闭StringReader) ts.end(); // Performend-of-stream operations, e.g. set the final offset. }catch(IOException e) { e.printStackTrace(); }finally{ //释放TokenStream的所有资源 if(ts !=null){ try { ts.close(); } catch (IOException e) { e.printStackTrace(); } } } }
运行之后的效果如下:
0 - 2 : 业余 | CN_WORD 2 - 3 : 草 | CN_CHAR 3 - 5 : 网站 | CN_WORD 6 - 21 : www.xttblog.com | LETTER 22 - 24 : 公众 | CN_WORD 24 - 25 : 号 | CN_CHAR 26 - 28 : 业余 | CN_WORD 28 - 29 : 草 | CN_CHAR 30 - 36 : yyucao | ENGLISH 38 - 47 : ikanalyer | ENGLISH 48 - 51 : can | ENGLISH 52 - 60 : analysis | ENGLISH 61 - 68 : english | ENGLISH 69 - 73 : text | ENGLISH 74 - 77 : too | ENGLISH
至此,Lucene 创建索引的内容,我们就介绍完了。下章我继续学习一些简单的检索教程。
: » Lucene 实战教程第二章入门教程 Hello World
原创文章,作者:端木书台,如若转载,请注明出处:https://blog.ytso.com/251958.html