
Lucene
arvin-qx
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
lucene3 分词器的使用
转载网址:http://extjs2.iteye.com/blog/818512 lucene3 中分词的一个例子 Java代码 import java.io.IOException; import java.io.StringReader;转载 2011-08-17 11:13:44 · 1067 阅读 · 2 评论 -
搜索引擎之中文分词(Chinese Word Segmentation)简介
转载网址:http://blog.minidx.com/2008/01/04/352.html 在《“全文检索(full-text search)”和“搜索引擎(search engine)”的区别和联系》中我们提及到了中文分词,以及《双数组Trie(Double转载 2011-08-16 16:13:02 · 1301 阅读 · 0 评论 -
一个简单的Lucene例子
/** * 只是简单的一个关键词的搜索 * 应用范围狭窄 只能搜索txt文件 * 不支持中文 * 只能搜索独立的关键词 如关键词lucene * 不能搜索出luceneinaction lucene.txt等连载一起的字符关键词 */ pa原创 2011-08-15 16:20:13 · 732 阅读 · 0 评论 -
Lucene:基于Java的全文检索引擎简介
原址:http://www.chedong.com/tech/lucene.html Lucene:基于Java的全文检索引擎简介 Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史转载 2011-08-15 11:22:42 · 633 阅读 · 0 评论 -
lucene 索引非txt文档 (pdf word rtf html xml)
搜索要首先要索引,索引的话最简单的方式是索引txt文件,上文已经介绍了。这里介绍一下一些其它格式的文档的索引,例如ms word ,pdf ,rtf等。 索引方法:就是先把各种文档先转化成纯文本再索引,所以关键在转换上。幸好java世界中有太多的开源工程,很多都可以拿来直接原创 2011-08-16 08:57:58 · 1016 阅读 · 1 评论