线性代数笔记13:PageRank问题建模

PageRank是谷歌搜索引擎关键技术,通过分析网页链接关系计算重要性。文章介绍了PageRank的核心思想,即重要网页链接到的网页也会提高其PR值。接着,建立了大规模系数矩阵模型,解释了网页间转移概率的计算,并描述了PageRank向量的收敛性质。最后,提到了算法的实现和参考资料。

PageRank是谷歌搜索引擎的核心技术,在学习了矩阵之后,用这个实际例子实验一下。

问题提出

PageRank的核心思想就是:

  1. 如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高
  2. 如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页的PageRank值会相应地因此而提高

因此,我们希望计算出每个网站的PR值,通过这个值来反映网站的重要程度,进而对网站排序。

这样,我们就可以对这个问题进行如下建模和猜想:

假设 n n 是所有可访问网页的数目,此数值非常大,定义 n × n 为网页链接矩阵 G=(gij)Rn×n G = ( g i j ) ∈ R n × n ,若从网页 j j 有一个链接到网页 i ,则 gij=1 g i j = 1 ,否则为0。矩阵 G G 有如下特点:

  1. G 是大规模系数矩阵;

    • j j 列非零向量的位置表示了从网页 j 链接出去的所有网页;
    • i i 行非零向量的位置表示了所有链接到网页 i 的网页;
    • G G 中非零向量的数目为整个网络中存在的超链接的数目;
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值