
搜索引擎
wyymaomi
这个作者很懒,什么都没留下…
展开
-
实战 Lucene,第 1 部分: 初识 Lucene
Lucene简介 Lucene是一个基于Java的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene目前是Apache Jakarta家族中的一个开源项目。也是目前最为流行的基于Java开源全文检索工具包。 目前已经有很多应用程序的搜索功能是基于Lucene的,比如Eclipse的帮助系统的搜索功能。Lucene能够为文本类型的数据转载 2008-11-24 10:41:00 · 577 阅读 · 0 评论 -
开源网络爬虫程序(spider)一览
spider是搜索引擎的必须模块.spider数据的结果直接影响到搜索引擎的评价指标.第一个spider程序由MIT的Matthew K Gray操刀该程序的目的是为了统计互联网中主机的数目Spier定义(关于Spider的定义,有广义和狭义两种).狭义:利用标准的http协议根据超链和web文档检索的方法遍历万维网信息空间的软件程序. 广义:所有能利用http协议检索web文档的转载 2008-12-03 17:29:00 · 1985 阅读 · 0 评论 -
什么是网络爬虫---Java Web Spider
随着网络技术的发展,互联网已经成为海量信息的载体,随着人们对这些信息进行有效提取以及应用的需求的增加,搜索引擎(Search Engine)应运而生,例如传统的通用搜索引擎AltaVista,Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性,如: 1、针对不同需求,不同背景的用户,搜索引擎还不够智能,返回的结转载 2008-12-03 17:33:00 · 2022 阅读 · 1 评论 -
基于ProActive的分布式并行Web Spider的设计与实现
摘要:由于互联网具有海量信息并且快速增长,提高搜索引擎的信息采集器Web Spider的数据采集和更新速度有重要意义。本文利用ProActive网格网络并行分布计算中间件提供的主动对象(Active Object)技术、网络并行计算技术、自动部署机制等设计和实现了一个名为P-Spider的分布式并行Web Spider,实验表明该Web Spider方便管理和部署,并且比多线程Web Spider转载 2008-12-03 17:36:00 · 874 阅读 · 0 评论 -
用户需要什么样的无线搜索
试用这么多国内的无线搜索产品,从互联网搜索大头Google、百度到无线搜索新贵Cgogo、UUCUN,无论是在搜索结果上还是搜索体验中总感觉不是用户想要的那种搜索产品,所有的无线搜索都是互联网搜索的翻版,太多的搜索按钮,一大堆的链接……,每个无线搜索公司提供的都是许多搜索产品,给人感觉就是什么都搜,但是什么都搜不好,如果再按照互联网搜索的路子来设计无线搜索,可以说是死路一条,因为无线搜索从其诞生转载 2008-12-12 14:17:00 · 611 阅读 · 0 评论