
Lucene
shihuacai
这个作者很懒,什么都没留下…
展开
-
Lucene实战阅读笔记1
Solr Lucene子项目,支持从关系数据库和XML文档中提取原始数据,以及能够通过集成Tika来处理复杂文档。 Nutch Lucene子项目,它包含大规模的爬虫工具,能够抓取和分辨Web站点数据。 Heritrix 开源的Internet文档搜索程序。 Drods Lucene子项目,目前正处于筹备状态。 Aperture 它支持从Web站点、文件系统转载 2012-12-10 21:00:13 · 805 阅读 · 0 评论 -
图解lucene TermVector
如果不是Field.Store.YES, 无法保存TermVector. 索引数据为Amsterdam has lots of bridges in Amsterdam WhitespaceAnalyzer 1 TermVector.YES 2 TermVector.WITH_POSITIONS 3 TermVector.WITH_OFFSETS转载 2013-09-28 17:39:29 · 2554 阅读 · 0 评论