PageRank算法

应用:
对于网页检索结果进行排序
核心思想:
指向一个网站的链接越多,这个网站就越重要;如果一个网站被一些很重要的网站指向,那么这个网站也很重要。
PageRank最简单的公式:
 
u是一个网页,Bu是指向u的所有网页的集合,R为最简单的PageRank值,c为标准化因子(0<c<1),Nvv指向其他网页的总链接数量。
遇到的问题:
1)一些网页没有外链
2)一些网页构成循环
解决:
 
增加E,其中E(u)为第u个网页的逃脱因子。
矩阵表示为
 
u有指向v的链接则Au,v1/Nu ,否则为0,令||R’||1 = 11为全1的向量
PageRank计算:
 
总结:
PageRank通过网页的超链接关系计算得到,有效地提高了检索的效率。

转载于:https://www.cnblogs.com/sancallejon/p/4963617.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值