
lucene
lvlianghui
这个作者很懒,什么都没留下…
展开
-
lucene的排序方式
lucene的查询排序有两种方式,一种是按照相关性排序,一种是按照域值排序 相关性排序api:public TopDocs search(Query query, int n)会对每个命中文档进行相关性打分,并返回得分最高的n个文档。 域值排序api:public TopFieldDocs search(Weight weight, ...原创 2013-04-22 14:24:04 · 198 阅读 · 0 评论 -
lucene范围查询
lucene 范围查询NumericRangeQuery索引时,将数值按位切分为多个不同步长(不同精度)的域,不同步长的域分别建索引,查询时,也将查询的范围值按照多个步长划分到不同步长的域上查询,这样能减少查询的term的数量。FieldCacheRangeFilter使用lucene的FieldCache,即将字段值用大数组缓存起来,数组下标是docid,值是字段值,查询时,进行...原创 2013-05-14 17:23:33 · 232 阅读 · 0 评论 -
多线程构建lucene索引遇到的并发锁问题
最近把一个多线程构建lucene索引的程序 从lucene2.9.1版本迁移到3.4版本,索引的时间增加了1/2。 一开始怀疑是代码问题,从头到尾,检查了一遍代码,没发现会导致性能下降的地方。 接着查了下机器负载,发现cpu负载比原来2.9.1版本要低一些,然后增加了线程数,发现load还是上不去。 怀疑多线程间有资源竞争了,用jstack 看了一下,果然,发现很多锁等...2013-06-04 09:27:00 · 266 阅读 · 0 评论