
lucene
jstkss
这个作者很懒,什么都没留下…
展开
-
lucene omitNorms 的影响
在索引阶段设置Document Boost和Field Boost,存储在(.nrm)文件中。如果希望某些文档和某些域比其他的域更重要,如果此文档和此域包含所要查询的词则应该得分较高,则可以在索引阶段设定文档的boost和域的boost值。这些值是在索引阶段就写入索引文件的,存储在标准化因子(.nrm)文件中,一旦设定,除非删除此文档,否则无法改变。如果不进行设定,则Document转载 2015-12-29 10:29:55 · 968 阅读 · 0 评论 -
query
ConstantScoreQueryStrips off scores from the passed in Query. The hits will get a constant score * dependent on the boost factor of this query.会消耗系统性能,不建议使用。原创 2016-03-09 16:20:49 · 341 阅读 · 0 评论 -
技术博客收藏
爱开卷360 lucene原创 2016-01-18 10:18:37 · 414 阅读 · 0 评论 -
lucene index 锁
http://www.cnblogs.com/likehua/archive/2012/02/16/2354532.htmlhttp://www.blogjava.net/guming123416/archive/2011/02/28/269036.html转载 2016-03-30 18:11:26 · 426 阅读 · 0 评论 -
范围查询
http://jimmee.iteye.com/blog/2041374转载 2016-03-02 18:20:44 · 388 阅读 · 0 评论 -
Lucene5 源码分析
原创 2016-02-01 23:46:41 · 739 阅读 · 0 评论 -
繁简体楼盘名搜索
锦园·曲江龙邸,曲江龍邸 分别是两个不同的楼盘。修改Myzhcoder,龍不进行繁简体转换。原创 2016-01-25 09:11:01 · 601 阅读 · 0 评论 -
中文分词
一、 为什么要进行中文分词?词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记。二、 中文分词技术一类方法应用 词典匹配(词典能穷举所有词语?歧义词如何处理?)、汉语词法(汉语有语法么?)或其它汉语语言知识进行分词,如:最大匹配法、最小分词方法等。这类方法简单、转载 2016-02-01 00:48:21 · 515 阅读 · 0 评论 -
maven lucene
使用maven构建项目:http://maven.outofmemory.cn/org.apache.lucene/lucene-core/5.0.0/ org.apache.lucene lucene-core 5.0.0原创 2016-01-31 16:57:18 · 1786 阅读 · 0 评论 -
升级lucene5 问题
1. solr建索引时,schema.xml 中field定义跟 xml数据文件定义的不一致,导致对应域没有被索引。schema.xml中:tag" type="text_cn" indexed="true" stored="true"/>xml数据文件中:tags">xxxxx2. 繁简体转换 Myzhcoder.jar 的问题修改过里面的原创 2016-01-07 10:12:18 · 539 阅读 · 0 评论 -
booleanQuery 逻辑
Occur.SHOULD, MUST 完全对照业务逻辑去组合即可。原创 2015-12-25 10:50:46 · 430 阅读 · 0 评论 -
lucene 评分公式 ——forfuture1978
Lucene的打分公式非常复杂,如下:coord(q,d):此项表示,当一篇 文档(document) 中包含的搜索词(query terms)越多,则此文档则打分越高。queryNorm(q):此值并不影响排序,而仅仅使得不同的query之间的分数可以比较。其公式如下:t in q: Term t tf(t in d):Term t在文转载 2015-12-29 10:56:32 · 513 阅读 · 0 评论 -
sort
public static final Sort DEFAULT_SORT = new Sort(new SortField[] { new SortField("year", SortField.INT, true), SortField.FIELD_SCORE, SortField.FIELD_DOC });原创 2016-03-28 16:25:31 · 260 阅读 · 0 评论