
搜索引擎
文章平均质量分 65
itfafa
这个作者很懒,什么都没留下…
展开
-
PrefixQuery前缀搜索符合的所有放入map
/** PrefixQuery前缀搜索符合的所有放入map * @param File indexDir,索引目录; * @param String word 索引关键词前缀 * @return Map * @author niewj @since 2011-3-10 */ p...原创 2012-07-17 10:37:32 · 113 阅读 · 0 评论 -
《Lucene in action》中推荐的Lucene分页方式
在《Lucene in action》 中专门讨论了如何对Hits进行分页,提供了两条路:一是在用户进行分页导航的过程中保持Hits和IndexSearcher的可用状态,也就是说不能在搜索之后关闭IndexSearcher,并且还要将Hits保存到Session中。而推荐的做法是为每一次分页导航都执行一次新的查询。因为Hits中保存的并不是真正的Document,因此可以通过HIts.doc(i...原创 2012-09-28 16:33:44 · 80 阅读 · 0 评论 -
使用solr搭建你的全文检索
Solr 是一个可供企业使用的、基于 Lucene 的开箱即用的搜索服务器。对Lucene不熟?那么建议先看看下面两篇文档:实战Lucene,第 1 部分: 初识 Lucene:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/用Lucene加速Web搜索应用程序的开发:http://www.ibm.com/develop...原创 2012-09-28 16:34:52 · 76 阅读 · 0 评论 -
用MultiSearcher在多索引中进行搜索
/** * 多索引进行查询 */ public void testCreateIndex() { Analyzer analyzer = new IKAnalyzer(); String atext ="明年起,杭州将对两区五县(市)居民发放市民卡,实现杭州市域范围医保“一卡通”凭卡就医。12月底,首批发卡工作将...原创 2013-07-09 09:45:06 · 402 阅读 · 0 评论 -
lucene 中一个Filed中包含多值的范围查询
package tools.lucene; import java.io.File; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.PerFieldAnalyzerWrapper; import org...原创 2013-07-09 09:45:24 · 386 阅读 · 0 评论 -
lucene3搜索引擎,索引建立搜索排序分页高亮显示, IKAnalyzer分词
package com.zjr.service.impl; import java.io.File; import java.io.IOException; import java.io.StringReader; import java.lang.reflect.InvocationTargetException; ...原创 2013-01-27 19:17:26 · 122 阅读 · 0 评论 -
Lucene为不同字段指定不同分词器(转)
在lucene使用过程中,如果要对同一IndexWriter中不同 Document,不同Field中使用不同的analyzer,我们该如何实现呢?通过对《lucene in action》的阅读,发现是可以解决这一问题的。lucene可以正对整个IndexWriter对象或者每一个document对象或者特定 Field使用不同的分析器。Java代码 复制代码 Anal...原创 2013-01-31 17:34:37 · 459 阅读 · 0 评论 -
Lucene3.0详解
★第一部分:概述1. 我们在很多地方都可以看到搜索功能1, Windows系统中的有搜索功能:打开“我的电脑”,按“F3”就可以使用查找的功能,查找指定的文件或文件夹。搜索的范围是整个电脑中的文件资源。2, Eclipse中的帮助子系统:点击HelpàHelpContents,可以查找出相关的帮助信息。搜索的范围是Eclipse的所有帮助文件。3, 在BBS、BLOG等...原创 2013-02-01 10:57:45 · 154 阅读 · 0 评论 -
Compass将lucene、Spring、Hibernate三者结合
版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明http://wemyss.blogbus.com/logs/8014799.html1.概述Compass将lucene、Spring、Hibernate三者的起来,以很低很低的成本快速实现企业应用中的搜索功能。HomePage: http://www.opensymphony.com/compass/ ...原创 2013-02-01 11:02:12 · 116 阅读 · 0 评论 -
lucene索引word/pdf/html/txt文件及检索(搜索引擎)
因为lucene索引的时候是将String型的信息建立索引的,所以这里必须是将word/pdf/html等文件的内容转化问字符型。lucene的jar包自己去下载。首先是建立索引的代码:public class TextFileIndexer { public static void main(String[] args) throws Exception { ...原创 2012-09-28 16:29:20 · 289 阅读 · 0 评论 -
SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎
前两天看到了一个中国新闻网,这个网站的搜索form的action是http://search.chinanews.com/search.do便知道是struts1的产物,现在都用struts2了,所以给自己的任务是实现Struts2 SSH分页浏览新闻、Lucene分页高亮排序搜索新闻这个两个功能。 IDE使用的MyEclipse6.5,数据库使用MySQL...原创 2012-11-19 09:55:38 · 145 阅读 · 0 评论 -
Lucene多字段搜索
最近在学习Lucene的过程中遇到了需要多域搜索并排序的问题,在网上找了找,资料不是很多,现在都列出来,又需要的可以自己认真看看,都是从其他网站粘贴过来的,所以比较乱,感谢原创的作者们! 使用MultiFieldQueryParser类即可。示例代码:Java代码 收藏代码 package com.lucene.search; i...原创 2012-11-19 09:53:54 · 90 阅读 · 0 评论 -
Solr快速教程
Solr快速教程加载及配置步骤:1.下载最新版本的Solr(当前为v1.4); 下载地址:http://lucene.apache.org/solr/ 选择resource-download下载2.解压到随便一个地方,拿出以下两个文件:解压目录/dist/apache-solr-1.4.0.war;解压目录/example/solr;确保solr目录有以下文...原创 2012-07-17 10:38:25 · 102 阅读 · 0 评论 -
solr部署
1. 认识到solr是作为一个webapp角色;2. 找到下载solr目录dist下的war包,放到tomcat\webapps目录下面3. 启动tomcat;4. tomcat启动后会自动加载这个war包,可以看到webapps下自动生成了solr(因为我把war包名字改成了"solr")目录,打开此目录下的WEB-INF\web.xml,做以下步...原创 2012-07-17 10:41:11 · 81 阅读 · 0 评论 -
lucene 中一个Filed中包含多值的范围查询
package tools.lucene; import java.io.File; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.PerFieldAnalyzerWrapper; import org...原创 2012-07-17 10:50:31 · 134 阅读 · 0 评论 -
使用lucene PrefixQuery 根据拼音前缀查询
PrefixQuery类似于 数据库中的 like 'a%'查询以下是测试代码,这种方式的缺陷是人为的分出了更多的term,目前还在找有没有更优的方法。测试代码: public static String index_path3="D:\\ix3"; public static void main(String[]args) throws Exception{...原创 2012-07-17 10:52:18 · 226 阅读 · 0 评论 -
数据挖掘网址共享
数据挖掘网络应用搜索引擎企业应用Lotus[color=red][/color]知识型企业研究中心 2006-12-26http://business.queensu.ca/index.phpQueen商务学校,任务是提高领导力的管理和促进商务和社会的发展。目前我们的研究工作...英国谢菲尔德大学自然语言处理研究组 2006-12-26http://nlp.shef.ac....原创 2012-04-13 14:37:15 · 292 阅读 · 0 评论 -
(转载)Lucene几种中文分词的总结
Lucene几种中文分词的总结 博客分类: 聚类搜索引擎luceneApachePHP.netBlogIK_CAnalyzer下载地址:http://cn.ziddu.com/download.php?uid=ZrKcmJepZbOb4palZLKWlJiiZaycmps%3D4 目前最新版本的lucene自身提供的StandardAn...原创 2012-04-13 14:40:59 · 166 阅读 · 0 评论 -
Lucene相关度排序的调整
Lucene的搜索结果默认按相关度排序,这个相关度排序是基于内部的Score和DocID,Score又基于关键词的内部评分和做索引时的boost。默认Score高的排前面,如果Score一样,再按索引顺序,先索引的排前面。那么有人问了,如果我要先索引的排后面怎么办呢?隐士研究了源码后发现这是相当简单的事情。以下代码基于Lucene 2.0。看Sort的默认构造函数,相关度就是SortFie...原创 2012-11-16 11:38:33 · 166 阅读 · 0 评论 -
lucene之sort
package cn.zqh.lucene.sort;import java.io.IOException;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import org.apache.lucene.analysis.A...原创 2012-11-16 15:06:22 · 145 阅读 · 0 评论 -
(转)Lucene打分规则与Similarity模块详解
搜索排序结果的控制Lucnen作为搜索引擎中,应用最为广泛和成功的开源框架,它对搜索结果的排序,有一套十分完整的机制来控制;但我们控制搜索结果排序的目的永远只有一个,那就是信息过滤,让用户快速,准确的找到其想要的结果,丰富用户体验。以前看过一个牛人的博客,总结了4个地方,可对Lucene检索结果的排序进行控制,现在已经记不住。我自己简单整理了下面几个,若有疏漏,欢迎补充:1...原创 2013-02-06 14:08:29 · 204 阅读 · 0 评论