PageRank算法:定义、计算与应用
1. PageRank的基本定义
在一个具有n个节点的强连通且非周期性有向图中,我们可以基于它定义一个随机游走模型,这是一个一阶马尔可夫链。假设其转移矩阵为$M$,在时间$0,1,2,\cdots,t,\cdots$访问每个节点的概率分布分别为$R_0,MR_0,M^2R_0,\cdots,M^tR_0,\cdots$。当$t$趋向于无穷大时,极限$\lim_{t \to \infty} M^tR_0 = R$存在,这个极限向量$R$代表了马尔可夫链的平稳分布,满足$MR = R$。
定义 :给定一个包含$n$个节点$v_1,v_2,\cdots,v_n$的强连通且非周期性有向图,在该有向图上定义的随机游走模型(一阶马尔可夫链)中,从一个节点到所有通过有向边连接的节点的转移概率相等,转移矩阵为$M$。这个马尔可夫链的平稳分布$R$被称为该有向图的PageRank。$R$的每个分量称为每个节点的PageRank值,即$R = \begin{bmatrix}PR(v_1)\PR(v_2)\\vdots\PR(v_n)\end{bmatrix}$,其中$PR(v_i)$($i = 1,2,\cdots,n$)表示节点$v_i$的PageRank值,显然有$PR(v_i) \geq 0$($i = 1,2,\cdots,n$),且$\sum_{i = 1}^{n} PR(v_i) = 1$,同时$PR(v_i) = \sum_{v_j \in M(v_i)} \frac{PR(v_j)}{L(v_j)}$($i = 1,2,\cdots,n$),这里$M(v_i)$表示指向节点$v_i$的节点集合,$L(v_j)$表示连接到节点$
PageRank算法详解与应用
超级会员免费看
订阅专栏 解锁全文
1072

被折叠的 条评论
为什么被折叠?



