【Lucene3.6.2入门系列】第06节_高级搜索之排序

本文介绍Lucene 3.6.2中实现高级搜索排序的方法,包括按文档评分、文档编号、文件大小、文件日期及文件名等多种排序方式,并通过示例代码展示了如何创建索引及执行不同类型的排序。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

[java]  view plain copy print ?
  1. package com.jadyer.lucene;  
  2.   
  3. import java.io.File;  
  4. import java.io.IOException;  
  5. import java.text.SimpleDateFormat;  
  6. import java.util.Date;  
  7.   
  8. import org.apache.lucene.analysis.standard.StandardAnalyzer;  
  9. import org.apache.lucene.document.Document;  
  10. import org.apache.lucene.document.Field;  
  11. import org.apache.lucene.document.NumericField;  
  12. import org.apache.lucene.index.IndexReader;  
  13. import org.apache.lucene.index.IndexWriter;  
  14. import org.apache.lucene.index.IndexWriterConfig;  
  15. import org.apache.lucene.queryParser.QueryParser;  
  16. import org.apache.lucene.search.IndexSearcher;  
  17. import org.apache.lucene.search.ScoreDoc;  
  18. import org.apache.lucene.search.Sort;  
  19. import org.apache.lucene.search.SortField;  
  20. import org.apache.lucene.search.TopDocs;  
  21. import org.apache.lucene.store.Directory;  
  22. import org.apache.lucene.store.FSDirectory;  
  23. import org.apache.lucene.util.Version;  
  24.   
  25. /** 
  26.  * 【Lucene3.6.2入门系列】第06节_高级搜索之排序 
  27.  * @create Aug 19, 2013 10:38:19 AM 
  28.  * @author 玄玉<http://blog.youkuaiyun.com/jadyer> 
  29.  */  
  30. public class AdvancedSearchBySort {  
  31.     private Directory directory;  
  32.     private IndexReader reader;  
  33.       
  34.     public AdvancedSearchBySort(){  
  35.         /**文件大小*/  
  36.         int[] sizes = {901020106050};  
  37.         /**文件名*/  
  38.         String[] names = {"Michael.java""Scofield.ini""Tbag.txt""Jack""Jade""Jadyer"};  
  39.         /**文件内容*/  
  40.         String[] contents = {"my java blog is http://blog.youkuaiyun.com/jadyer",  
  41.                              "my Java Website is http://www.jadyer.cn",  
  42.                              "my name is jadyer",  
  43.                              "I am a Java Developer",  
  44.                              "I am from Haerbin",  
  45.                              "I like java of Lucene"};  
  46.         /**文件日期*/  
  47.         Date[] dates = new Date[sizes.length];  
  48.         SimpleDateFormat sdf = new SimpleDateFormat("yyyyMMdd HH:mm:ss");  
  49.         IndexWriter writer = null;  
  50.         Document doc = null;  
  51.         try {  
  52.             dates[0] = sdf.parse("20130407 15:25:30");  
  53.             dates[1] = sdf.parse("20130407 16:30:45");  
  54.             dates[2] = sdf.parse("20130213 11:15:25");  
  55.             dates[3] = sdf.parse("20130808 09:30:55");  
  56.             dates[4] = sdf.parse("20130526 13:54:22");  
  57.             dates[5] = sdf.parse("20130701 17:35:34");  
  58.             directory = FSDirectory.open(new File("myExample/01_index/"));  
  59.             writer = new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_36, new StandardAnalyzer(Version.LUCENE_36)));  
  60.             writer.deleteAll();  
  61.             for(int i=0; i<sizes.length; i++){  
  62.                 doc = new Document();  
  63.                 doc.add(new NumericField("size",Field.Store.YES, true).setIntValue(sizes[i]));  
  64.                 doc.add(new Field("name", names[i], Field.Store.YES, Field.Index.ANALYZED_NO_NORMS));  
  65.                 doc.add(new Field("content", contents[i], Field.Store.NO, Field.Index.ANALYZED));  
  66.                 doc.add(new NumericField("date", Field.Store.YES, true).setLongValue(dates[i].getTime()));  
  67.                 writer.addDocument(doc);  
  68.             }  
  69.         } catch (Exception e) {  
  70.             e.printStackTrace();  
  71.         } finally {  
  72.             if(null != writer){  
  73.                 try {  
  74.                     writer.close();  
  75.                 } catch (IOException ce) {  
  76.                     ce.printStackTrace();  
  77.                 }  
  78.             }  
  79.         }  
  80.     }  
  81.       
  82.     /** 
  83.      * 获取IndexReader实例 
  84.      */  
  85.     private IndexReader getIndexReader(){  
  86.         try {  
  87.             if(reader == null){  
  88.                 reader = IndexReader.open(directory);  
  89.             }else{  
  90.                 //if the index was changed since the provided reader was opened, open and return a new reader; else,return null  
  91.                 //如果当前reader在打开期间index发生改变,则打开并返回一个新的IndexReader,否则返回null  
  92.                 IndexReader ir = IndexReader.openIfChanged(reader);  
  93.                 if(ir != null){  
  94.                     reader.close(); //关闭原reader  
  95.                     reader = ir;    //赋予新reader  
  96.                 }  
  97.             }  
  98.             return reader;  
  99.         }catch(Exception e) {  
  100.             e.printStackTrace();  
  101.         }  
  102.         return null//发生异常则返回null  
  103.     }  
  104.       
  105.       
  106.     /** 
  107.      * 搜索排序 
  108.      * @see 关于Sort参数的可输入规则,如下所示 
  109.      * @see 1)Sort.INDEXORDER--使用文档编号从小到大的顺序进行排序 
  110.      * @see 2)Sort.RELEVANCE---使用文档评分从大到小的顺序进行排序,也是默认的排序规则,等价于search(query, 10) 
  111.      * @see 3)new Sort(new SortField("size", SortField.INT))-----------使用文件大小从小到大的顺序排序 
  112.      * @see 4)new Sort(new SortField("date", SortField.LONG))----------使用文件日期从以前到现在的顺序排序 
  113.      * @see 5)new Sort(new SortField("name", SortField.STRING))--------使用文件名从A到Z的顺序排序 
  114.      * @see 6)new Sort(new SortField("name", SortField.STRING, true))--使用文件名从Z到A的顺序排序 
  115.      * @see 7)new Sort(new SortField("size", SortField.INT), SortField.FIELD_SCORE)--先按照文件大小排序,再按照文档评分排序(可以指定多个排序规则) 
  116.      * @see 注意:以上7个Sort再打印文档评分时都是NaN,只有search(query, 10)才会正确打印文档评分 
  117.      * @param expr 搜索表达式 
  118.      * @param sort 排序规则 
  119.      */  
  120.     public void searchBySort(String expr, Sort sort){  
  121.         IndexSearcher searcher = new IndexSearcher(this.getIndexReader());  
  122.         QueryParser parser = new QueryParser(Version.LUCENE_36, "content"new StandardAnalyzer(Version.LUCENE_36));  
  123.         TopDocs tds = null;  
  124.         try {  
  125.             if(null == sort){  
  126.                 tds = searcher.search(parser.parse(expr), 10);  
  127.             }else{  
  128.                 tds = searcher.search(parser.parse(expr), 10, sort);  
  129.             }  
  130.             for(ScoreDoc sd : tds.scoreDocs){  
  131.                 Document doc = searcher.doc(sd.doc);  
  132.                 System.out.print("文档编号=" + sd.doc + "  文档权值=" + doc.getBoost() + "  文档评分=" + sd.score + "    ");  
  133.                 System.out.println("size=" + doc.get("size") + "  date=" + new SimpleDateFormat("yyyyMMdd HH:mm:ss").format(new Date(Long.parseLong(doc.get("date")))) + "  name=" + doc.get("name"));  
  134.             }  
  135.         } catch (Exception e) {  
  136.             e.printStackTrace();  
  137.         } finally {  
  138.             if(searcher != null){  
  139.                 try {  
  140.                     searcher.close();  
  141.                 } catch (IOException e) {  
  142.                     e.printStackTrace();  
  143.                 }  
  144.             }  
  145.         }  
  146.     }  
  147.       
  148.       
  149.     /** 
  150.      * 测试一下排序效果 
  151.      */  
  152.     public static void main(String[] args) {  
  153.         AdvancedSearchBySort advancedSearch = new AdvancedSearchBySort();  
  154. //      //使用文档评分从大到小的顺序进行排序,也是默认的排序规则  
  155. //      advancedSearch.searchBySort("Java", null);  
  156. //      advancedSearch.searchBySort("Java", Sort.RELEVANCE);  
  157. //      //使用文档编号从小到大的顺序进行排序  
  158. //      advancedSearch.searchBySort("Java", Sort.INDEXORDER);  
  159. //      //使用文件大小从小到大的顺序排序  
  160. //      advancedSearch.searchBySort("Java", new Sort(new SortField("size", SortField.INT)));  
  161. //      //使用文件日期从以前到现在的顺序排序  
  162. //      advancedSearch.searchBySort("Java", new Sort(new SortField("date", SortField.LONG)));  
  163. //      //使用文件名从A到Z的顺序排序  
  164. //      advancedSearch.searchBySort("Java", new Sort(new SortField("name", SortField.STRING)));  
  165. //      //使用文件名从Z到A的顺序排序  
  166. //      advancedSearch.searchBySort("Java", new Sort(new SortField("name", SortField.STRING, true)));  
  167.         //先按照文件大小排序,再按照文档评分排序(可以指定多个排序规则)  
  168.         advancedSearch.searchBySort("Java"new Sort(new SortField("size", SortField.INT), SortField.FIELD_SCORE));  
  169.     }  
  170. }  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值