PageRank算法和HITS算法

本文介绍了PageRank和HITS两种链接分析方法,包括随机游走模型、子集传播模型,以及这两种算法的基本思想、迭代过程和应用场景。PageRank算法重视页面的入链数量和质量,而HITS算法关注Hub页面和Authority页面的相互增强关系,是一种与查询相关的算法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

楼楼刚才想了一个特别骚情的标题,叫PageRank算法和HITS算法的“前世今生”,特别像之前写头条号的套路,然后就想起来去年6月份自己有在经营一个技术型的头条号,后来因为做不到一天一篇的更新频率被我弃坑了,现在手机号换了,登陆不了,去主页看了看之前写的文章,竟然被一直这么努力的自己感动到了。:)

PageRank算法和HITS算法都属于比较著名的链接链接分析方法,作为经典方法,由此也衍生出一些列相关方法,从下图就可以看出这两种方法的前世今生。

随机游走模型:

随机游走模型就和它字面意思所表述的那样,用户的浏览在网页之间进行跳转,假设网页包含k个出链, 用户从当前页面跳转到这k个页面的概率是相等的。用户不断重复上述过程,在相互有链接指向的页面之间跳转,如果对于某个页面所包含的所有链接,用户都没有兴趣继续浏览, 则可能会在浏览器中输入另一个网址,直到到达该网页,这种行为被称为“远程跳转” 。而随机游走模型就是一个对直接跳转和远程跳转两种用户浏览行为进行抽象的概念模型。

实例

子集传播模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值