
无限搜索
sharpdew
这个作者很懒,什么都没留下…
展开
-
Indri 开源搜索引擎
一直对Lemur有所熟悉,有感于国外大学在研究和实践上的并驾齐驱,特翻译并撰写Indri开源搜索引擎的相关文章,以供志趣相同者共同参考。 Indri是一个完整的开源搜索引擎,由卡耐基-梅隆大学Lemur项目组维护并持续开发。尽管只是Lemur信息获取工具系列的一部分,然而由于其使用最新的语言模型,高效的索引技术,完整的搜索引擎解决方案,不乏为搜索相关专业及爱好者研究之典范。 支原创 2005-07-29 09:35:00 · 7830 阅读 · 0 评论 -
Indri 动态文档索引技术
Indri中的动态文档索引技术戴维 译 摘要: Indri 动态文档索引的实现技术,支持在更新索引的同时处理用户在线查询请求。 文本搜索引擎曾被设计为针对固定的文档集合进行查询,对不少应用来说,这种机制工作得很好,然而对于诸于新闻,财经和桌面搜索而言,需要的是高效、经常性的更新索引。 以往支持动态文档集合的研究主要围绕增量索引方法,增量系统通过往已有的索引中追加大的文档集合来优化索引性翻译 2005-07-29 09:52:00 · 7201 阅读 · 1 评论 -
搜索引擎中几种语言模型的性能比较
[正文等待上传......]人工构建中文query,对人民日报语了进行测试,各种语言模型的效果对比结果如下: 插值 recall-precision 曲线图原创 2005-07-29 17:00:00 · 3158 阅读 · 2 评论 -
Indri 信息检索模型
Indri 信息检索模型戴维整理介绍 本文旨在阐述Indri所实现的检索模型及其相关细节。参考文献:Lavrenko, V. and Croft, W.B., "Relevance-Based Language Models," Proceedings of the 24th Annual international ACM SIGIR Conference on Research原创 2005-08-12 09:36:00 · 4715 阅读 · 1 评论 -
如此谷歌
从谷歌的输入法事件,到其逃税丑闻,从其页面变脸,到令人啼笑皆非的人肉搜索,再联想到其领导人道貌岸然的四处布道,发现谷歌已经离人名心目中纯净的google相去甚远了。如果说输入法事件只是某个急于求成的工程师的无心之失的话,那么逃税丑闻应该就是整个公司管理层的预谋之举了;如果说页面变脸只是为了迎合所谓本地人的习惯,那么人肉搜索就是赤裸裸的用一个蹩脚的名字来进行毫无意义的模仿;在号称从来不缺乏创新的g原创 2008-04-01 13:49:00 · 3092 阅读 · 0 评论