该算法就是计算一个页面的权重。
数据结构:
两个数据集:
1)[pageID, 链接列表],包含每个页面的相邻页面;
2)[pageID, rank],包含每个页面的rank。
算法执行过程:
1.Initialize each page’s rank to 1.0.
2.On each iteration,hava page p send a contribution of rank(p)/numNeighbors(p) to its neighbors (the pages it has links to).
3.Set each page’s rank to 0.15+0.85 * contributionsReceived.
1.初始化每个页面的rank值为0
2.在每次迭代中,页面p向自己所有的邻居发送自己的贡献值,贡献值=rank(p)/numNeighbors(p)
3.将每个页面的rank值设为0.15+0.85*contributionReceived
后面两个步骤需要多次迭代,该算法将收敛到每个页面的pageRank值。实际情况中通常需要10轮迭代。