一、算法简单说明
PageRank算法是一种常见的网络权值迭代算法,主要用于诸如互联网网页的质量测度。基本计算原理是根据网页自身的链出将原始权值进行扩散,并通过多轮迭代获得稳定的收敛值来表征网页自身的最终权值。基本计算公式为:

其中R(u)'和R(u)分别表示网页u的新权值和上次计算的旧权值,Bu表示网页u的链入网页集合,Nv表示网页u的一个链入网页v全部的链出数量。
下面通过一个例子说明基本计算方法。假设有5个网页,链接关系如:

初始设置每个网页的权值都为0.2,即网页总数分之一。
第一轮计算为:

再加上每个网页各自的原始权值,可以得到第一轮计算后每个网页的新权值,即:

利用权值总和(为2)去除每个权值得到规范化后的权值为:

最低0.47元/天 解锁文章
1106

被折叠的 条评论
为什么被折叠?



