机器学习手记[7-2]-PageRank算法再思考

本文探讨了PageRank算法在处理网络中强连通、终止点(Deadend)和蜘蛛陷阱(SpiderTrap)问题时的原理和挑战。通过矩阵分析解释了Deadend导致的资源浪费和SpiderTrap造成的资源不平衡,并提出了心灵漂移(teleporting)作为通用的解决措施。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

[TOC]

一、目的

之前看过一些PageRank的知识和源码,自己也动手了一遍。今天看那本mining of massive dataset讲PageRank章节的时候,对PageRank又有了更多的理解,现在阐释如下。 PageRank算法研究网络之间的相互引用的问题,我认为可以看成一种“名声资源”的流动的过程。流动的这个过程其实就是马尔科夫过程,而我们要求的PageRank值就是达到平衡状态时的值。

二、马尔科夫过程平衡两个条件
  1. 强连通。 就是各个节点能够相互访问
  2. 没有终止点。
三、PageRank两个问题

这两个条件的不满足其实就造成了PageRank算法需要面对的两个问题。

3.1 Dead

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值