
搜索引擎
文章平均质量分 62
woshixhw
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
htmlparser.jar 下载地址
<br />原文出处:http://blog.sina.com.cn/s/articlelist_1766082610_5_1.html<br /> <br />htmlparser是一个解析HTML的组件,功能非常的强大,这个是jar包,非常好用啊<br />http://downloads.sourceforge.net/project/htmlparser/Integration-Builds/2.0-20060923/HTMLParser-2.0-SNAPSHOT-bin.zip<br />原创 2010-10-11 14:06:00 · 1747 阅读 · 0 评论 -
搭建基于nutch的搜索引擎
原文出处: http://blog.sina.com.cn/s/blog_694448320100kzsc.html这两天闲着没事,看了看开源项目luncence和nutch,冲动之下利用nutch搭建一个简单的仿百度下的小小的搜索引擎,在搭建过程中,参考了于天恩老师写的《LUCENE搜索引擎开发权威经典》一书中后面的一章,感觉这本书对lucence的知识写的通俗易懂,下面说下搭建nutch的方法:准备软件:cywin:下载地址: http://inst.eecs.berkeley原创 2010-10-11 14:07:00 · 617 阅读 · 0 评论 -
lucene学习之执行搜索
本篇文章主要介绍lucene建立的索引进行搜索,如果想看看索引的创建请看我的另外一篇文章《lucene学习之创建索引的方式》1:执行搜索的基本方式:①创建搜索器对象:IndexSearch创建搜索器对象:IndexSearch的方法如下:IndexSearch search = new IndexSearch(索引存放路径);创建搜索器之后就可以使用它进行搜索了,它常用的方法是search()。使用search方法返回一个结果集对象,即Hits。例如:Hits b = search.search();执行完原创 2010-10-11 13:59:00 · 1095 阅读 · 0 评论 -
lucene学习之创建索引的方式
1:理解创建索引的过程创建索引的过程可以类比为写文集,下面以文集的写作为例进行详解,文集里面有许多文章,每一章包括标题、内容、作者名称、写作时间等信息。首先为每一篇文章添加标题、内容、写作时间等信息,从而写好每一篇文章。然后把每一篇文章添加到书里面去。这样,文集就写好了。创建索引的过程如下:1建立索引器IndexWriter,这相当于一本书的框架。2建立文档对象Document,这相当于一篇文章3建立信息字段对象Field,这相当于一篇文章的不通信息(标题正文).4将Field添加到Document里面。5原创 2010-10-11 13:58:00 · 1195 阅读 · 0 评论