
搜索lucence
风不清云不淡
在风轻云淡的春天里,踏青也许是最好的选择,做coding是不是太浪费了。。。恩,还是晚上coding吧。
展开
-
Lucene学习总结之一:全文检索的基本原理
Lucene学习总结之一:全文检索的基本原理文章分类:Java编程本文csdn中的位置http://blog.youkuaiyun.com/forfuture1978/archive/2009/10/22/4711308.aspx一、总论根据http://lucene.apache.org/java/docs/index.html定义:Lucene是一个高效的,基于Java的全文检索库转载 2010-04-30 18:57:00 · 773 阅读 · 0 评论 -
Heritrix信息集合
HeritrixHeritrix是一个爬虫框架,可加如入一些可互换的组件。 它的执行是递归进行的,主要有以下几步: 1。在预定的URI中选择一个。 2。获取URI 3。分析,归档结果 4。选择已经发现的感兴趣的URI。加入预定队列。 5。标记已经处理过的URI Heritrix主要有三大部件:范围部件,边界部件,处理器链 范围部件:主要按照规则决原创 2010-05-01 20:23:00 · 2546 阅读 · 0 评论