Lucene的简单查询(二)

最新推荐文章于 2025-08-21 22:24:48 发布

原创最新推荐文章于 2025-08-21 22:24:48 发布 · 117 阅读

0 ·

CC 4.0 BY-SA版权

lucene 专栏收录该内容

13 篇文章

订阅专栏

本文介绍了Lucene搜索引擎中的查询技巧，包括基本查询方法、排序、过滤及多域查询等核心功能。通过示例展示了如何使用不同的查询方式来提高搜索效率。

一、查询

1.查询的基本方法

           search.search(query, results)
	   search.search(query, n)
	   search.search(query, filter, results)
	   search.search(query, filter, n)
	   search.search(query, n, sort)
	   search.search(query, filter, n, sort)
	   search.search(query, filter, n, sort, doDocScores, doMaxScore)

2.平时常用的基本方法排序

search(query,n)//这样自动排一个序，根据文档的综合得分 倒序排列

search.search(query, n, Sort.INDEXORDER); //根据doc的ID来排序的

search.search(query, n, Sort.RELEVANCE);跟默认的分排序时一样的

search.search(query,n, new Sort(new SortField("time", SortField.Type.LONG)));//但是添加了一个域用添加索引的时间，这样排序是根据整个索引匹配的时间向下递增的

search.search(query, n, new Sort(new SortField("time", SortField.Type.LONG,true))); //倒排

过滤

         Term t=new Term("type","俄国");
	  Query query_2=new TermQuery(t);
	  Filter categoryFilter=new QueryWrapperFilter(query_2);
	   TopDocs hits =search.search(query, categoryFilter, 10);
//把类别是俄国的从结果中筛选出来。结果还是按照得分倒排的

当然生成Sort的时候还可以添加多个，SortField实例化的时候是一个变参。

SortField.Type属性有多个有数据类型的，还有SCORE,DOC对准文档的。

三、MultiPhraseQuery

基本的用法

   MultiPhraseQuery query=new MultiPhraseQuery();
	   query.add(new Term[]{new Term("countent","兴奋"),new Term("countent","高兴")});
           query.add();//接着添加一个之不过应该是先匹配上面的 一个方面的多种情况
	   TopDocs hits=search.search(query, 10);
//是可以在同一个域中进行多项匹配索引。相当于or。不同域会报错的

转换//

 PhraseQuery p=new PhraseQuery();
	   p.setSlop(1);
	   p.add(new Term("countent","兴奋"));
	   p.add(new Term("countent","高兴"));
	   
	   PhraseQuery pp=new PhraseQuery();
	   pp.add(new Term("countent","快乐"));
	   pp.add(new Term("countent","高兴"));
	   
	   BooleanQuery query=new BooleanQuery();
	   query.add(p,BooleanClause.Occur.SHOULD);
	   
	   query.add(pp,BooleanClause.Occur.SHOULD);
	   
//p.setSlop(int);匹配因子可以精确查询，默认是0则是相邻的词组，不是则在这个范围内。

四、多域查询

1.直接用MultiFieldQueryParser进行跟据它的一些语法；

 Query query=new MultiFieldQueryParser(Version.LUCENE_42,new String[]{"countent","type"},new SmartChineseAnalyzer(Version.LUCENE_42)).parse("俄国 前少年");
	   TopDocs hits=search.search(query, 10);

中间的是：域和分词

  Query query=MultiFieldQueryParser.parse(Version.LUCENE_42, "俄国青少年", new String[]{"countent","type"},
			   new BooleanClause.Occur[]{BooleanClause.Occur.MUST,BooleanClause.Occur.MUST},new SmartChineseAnalyzer(Version.LUCENE_42) );
	   
	   TopDocs hits=search.search(query, 10);

中间的是：域和分词