1、PageRank 原理
(1) 算法定义:
PageRank 算法 |
输入:所有节点的初始权重值;节点邻接矩阵;迭代次数n 输出:节点权重值 while i < n: for x in nodelist: PR(x) = a + (1-a)*sum(PR(t)/C(t)) end for end i |
(2)算法示例(注:为简单起见,示例中省去了常量a和系数1-a)
PR(n2)=PR(n5)/C(n5)+PR(n1)/C(n1)=0.2/3+0.2/0.1=0.166
在计算节点n3时,仍使用PR(n2)=0.2。在图中所有节点更新一遍后,节点的PR值才会更新。
2、MapReduce 实现 PageRank
思路简介:
1、预处理输入文件
由于PageRank为迭代算法,map的输入与reduce的