
搜索引擎
文章平均质量分 85
gotohbu
学而时习之,可以为师矣。学而不思则罔,思而不学则殆。
展开
-
主流搜索引擎对用户点选命中的处理
主流搜索引擎对用户点选命中的处理 可能是因为存储成本的降低吧,现代搜引擎对数据的收集都是贪婪的。原来Google在首页上放了一个页面索引数量,记得最高已达到了8个多billion的页面数。另外搜索引擎记录用户搜索的关键字已不是什么秘密,但是大多搜索引擎还记录了用户点选命中。 用户点选命中这个概念是包含于搜索引擎命中这个范畴中的。搜索引擎的命中,就是你敲入关键字后,搜索引擎返回转载 2009-03-12 11:49:00 · 1011 阅读 · 0 评论 -
lucene快速入门
lucene快速入门 Lucene 简介 Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。 目前已经有很多应用程序的搜索功能是基于 Lucene 的,比如 Ecli原创 2009-04-28 14:39:00 · 630 阅读 · 0 评论 -
UrlRewriter技术简单运用
如何增强你网站中地址的可读性和让搜索引擎快速的收录到你的站点,这就需要你美化你的网页的地址,也就是我们常说的Url重写技术,大家熟悉的可能有很多服务器都提供Url重写的技术,以前我们用的最多的就是Apache,Jboss这样一些服务器自带的一些Url重写,但是他们的配置比较麻烦,性能又不是太好,现在我们有专一的开源框架来完成Url重写任务,今天我要介绍的就是UrlRewriter。使用起来比较简单原创 2009-08-14 11:55:00 · 917 阅读 · 0 评论 -
基于Java的全文索引引擎Lucene简介
关键词:Lucene java full-text search engine Chinese wordsegment内容摘要:Lucene是一个基于Java的全文索引工具包。基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切分词算法的比较 具体的安装和使用简介:系统结构介原创 2009-06-19 17:16:00 · 561 阅读 · 0 评论 -
lucene搜索引擎技术的分析与整理
1. 引言编写目的介绍开源软件搜索引擎——lucene的各个实现的功能,性能,以及代码分析1.2. 背景分析的系统名称 Lucene 该开源主页 http://lucene.apache.org/ 开发语言 JAVA 该系统的分析者 zzpchina 该系统作者简介 Lucene的贡献者Doug Cutting是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎(Apple的Coplan原创 2009-06-19 17:16:00 · 934 阅读 · 0 评论 -
Lucene 及 Lucene.net 国内外的一些学习资源汇总
目前互联网上关于Lucene 及 Lucene.net 的文章很多,看了一些,感觉绝大部分还是偏向于应用,真正深入探讨其核心算法的文章不是太多,最近打算深入研究一下Lucene.net,把一些关键技术点的核心算法搞清楚。在开始做这个工作之前,先对目前互联网上可以利用的资源做个汇总,算是抛砖引玉吧,还望网友们多来补充,大家共同学习! lucene 官方网站, Luncene.net 官方网转载 2009-06-19 17:20:00 · 672 阅读 · 0 评论