- 博客(2)
- 收藏
- 关注
转载 使用lucene做分组统计
这段时间考虑lucene的分组统计问题,网上查了不少文档,都没有给出效率比较高的解决方案。可以使用HitCollector对每个查询出来的document进行遍历,读取要分组的字段进行统计,但这样效率太低。以下是lucene API中对HitCollector的说明:Note: This is called in an inner search loop. For good search per
2008-09-10 09:59:00
614
转载 提高搜索性能方式
搜索 1、对于按创建时间的排序可以使用doc.id的方式 new SortField(null, SortField.DOC, reverse)排序方式尽量使用INT类型的字段 也就是按照写入索引的顺序排序 2、对于时间字符串的排序可以转换成整数进行排序 3、去掉不必要的parse 使用TermQuery替换 4、TermQuery和Term可以只保留一个实例 createTerm(text)
2008-09-10 09:56:00
385
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅