
搜索引擎
文章平均质量分 75
jinlaigu
这个作者很懒,什么都没留下…
展开
-
搜索引起的链接分析-计算网页的重要性
1. 链接分析 搜索引擎在查找能够满足用户请求的网页时,主要考虑两方面的因素: 网页和查询的相关性:是用户发出的查询与网页内容的内容相似性得分。 网页的重要性:通过链接分析方法计算获得的得分。 搜索引擎融合两者,共同拟合出相似性评分函数,来对搜索结果进行排序。 常见的链接分析算法除了鼎鼎有名的Pag转载 2014-08-11 10:57:42 · 644 阅读 · 0 评论 -
机器学习排序
从使用的数据类型,以及相关的机器学习技术的观点来看,互联网搜索经历了三代的发展历程。 第一代技术,将互联网网页看作文本,主要采用传统信息检索的方法。 第二代技术,利用互联网的超文本结构,有效地计算网页的相关度与重要度,代表的算法有 PageRank 等。 第三代技术,有效利用日志数据与统计学习方法,使网页相关度与重要度计算的精度转载 2014-08-11 11:01:15 · 549 阅读 · 0 评论 -
搜索引擎-倒排索引基础知识
搜索引擎的索引1.单词——文档矩阵 单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型,图3-1展示了其含义。图3-1的每列代表一个文档,每行代表一个单词,打对勾的位置代表包含关系。转载 2014-08-11 10:40:37 · 669 阅读 · 0 评论 -
关于搜索引擎及其开发
托google、百度们成功的福,搜索引擎火了半边天。很多人都想跨到这个行业里边来。前两天在公司里边面试了一些人,基本上没有感到满意。不是说从业经验不够,有些也已经工作了三年、四年。不过我估计,或者说是猜想,是不是做应用做的时间太长了,把数据结构、算法,时间、效率都扔到一边去了;然后平时的工作又太忙,平时自己工作的做的可以,但对工作相关的、稍微扩展的知识没有时间或者说是懒得去看了。。。。转载 2014-08-12 13:18:00 · 1106 阅读 · 0 评论 -
HTTP headers 详细介绍
什么是HTTP HeadersHTTP是“Hypertext Transfer Protocol”的所写,整个万维网都在使用这种协议,几乎你在浏览器里看到的大部分内容都是通过http协议来传输的,比如这篇文章。HTTP Headers是HTTP请求和相应的核心,它承载了关于客户端浏览器,请求页面,服务器等相关的信息。示例当你在浏览器地址栏里键入一个url,你的浏览器将会类似转载 2014-09-16 22:20:12 · 3096 阅读 · 0 评论