
Lucene
jbossday
这个作者很懒,什么都没留下…
展开
-
Apache Solr 介绍(1)
导言 说起Apache Lucene,可以说无人不知,无人不晓,但是说道Apache Solr,恐怕知道的不多。看看Apache Solr的说明: Solr是一个基于Lucene java库的企业级搜索服务器,包含XML/HTTP,JSON API, 高亮查询结果,faceted search(不知道该如何翻译,片段式搜索),缓存,复制还有一个WEB管理界面。Solr运行在Servle...2007-01-03 15:07:00 · 161 阅读 · 0 评论 -
Apache Solr 剖析系列(1)
本文是Apache Solr介绍的姊妹篇,我将逐一分析Apache Solr的各个包,力图详细地分析Solr的设计和架构。Apache Solr由12个包组成,如下: org.apache.solr.analysis org.apache.solr.core org.apache.solr.request org.apache.solr.schema or...2007-01-04 18:02:00 · 120 阅读 · 0 评论 -
转贴:Nutch爬虫工作流程及文件格式详细分析
Nutch爬虫工作流程及文件格式详细分析 Nutch主要分为两个部分:爬虫crawler和查询searcher。Crawler主要用于从网络上抓取网页并为这些网页建立索引。Searcher主要利用这些索引检索用户的查找关键词来产生查找结果。两者之间的接口是索引,所以除去索引部分,两者之间的耦合度很低。 Crawler和Searcher两部分尽量分开的目的主要是为了使两部分可以...2007-04-11 10:32:03 · 277 阅读 · 0 评论