[TOC]
一、目的
之前看过一些PageRank的知识和源码,自己也动手了一遍。今天看那本mining of massive dataset讲PageRank章节的时候,对PageRank又有了更多的理解,现在阐释如下。 PageRank算法研究网络之间的相互引用的问题,我认为可以看成一种“名声资源”的流动的过程。流动的这个过程其实就是马尔科夫过程,而我们要求的PageRank值就是达到平衡状态时的值。
二、马尔科夫过程平衡两个条件
- 强连通。 就是各个节点能够相互访问
- 没有终止点。
三、PageRank两个问题
这两个条件的不满足其实就造成了PageRank算法需要面对的两个问题。
3.1 Dead

本文探讨了PageRank算法在处理网络中强连通、终止点(Deadend)和蜘蛛陷阱(SpiderTrap)问题时的原理和挑战。通过矩阵分析解释了Deadend导致的资源浪费和SpiderTrap造成的资源不平衡,并提出了心灵漂移(teleporting)作为通用的解决措施。
最低0.47元/天 解锁文章
5834

被折叠的 条评论
为什么被折叠?



