
搜索引擎
ArvinStudy
这个作者很懒,什么都没留下…
展开
-
使用Solrj管理Solr索引
来自:http://blog.youkuaiyun.com/shirdrn/article/details/7094551Solrj是Solr搜索服务器的一个比较基础的客户端工具,可以非常方便地与Solr搜索服务器进行交互,最基本的功能就是管理Solr索引,包括添加、更新、删除和查询等。对于一些比较基础的应用,用Solj基本够用,而且你可以非常容易地通过使用Solrj的API实现与Solr搜索服务转载 2013-09-18 17:46:31 · 1219 阅读 · 1 评论 -
简单之美:布尔代数和搜索引擎的索引
来自:http://www.mysoo.com.cn/news/2006/20069475.shtml 世界上不可能有比二进制更简单的计数方法了,也不可能有比布尔运算更简单的运算了。尽管今天每个搜索引擎都宣称自己如何聪明、多么智能化,其实从根本上讲都没有逃出布尔运算的框框。 布尔(George Boole) 是十九世纪英国一位小学数学老师。他生前没有人认为他是数学家。布尔在工作之余,转载 2013-03-17 21:25:51 · 1013 阅读 · 0 评论 -
大数据量的过滤 (用于爬虫,蜘蛛) Bloom Filter 布隆过滤器
来自:http://www.cnblogs.com/lovebanyi/archive/2007/07/06/808736.html原文:Bloom Filters in C#http://www.devsource.com/article2/0,1895,2113495,00.asp想像一下.如果你有一个非常大的无序的数据(url连接) 并且你要保证同样的一条连接不会转载 2012-11-28 10:18:24 · 781 阅读 · 0 评论 -
Lucene 基础理论
来自:http://www.cnblogs.com/hoojo/archive/2012/09/06/2672891.html转载 2012-11-22 13:18:25 · 430 阅读 · 0 评论 -
谷歌搜索引擎
英文:http://www.google.com.hk/search?q=haier&hl=EN&newwindow=1&safe=strict&gbv=2&prmd=imvnsa&start=0&sa=N中文:http://www.google.com.hk/search?q=haier&hl=zh-CN&newwindow=1&safe=strict&gbv=2&prmd=imvnsa&s原创 2012-04-01 12:32:31 · 3617 阅读 · 0 评论