Spark实战 —— PageRank算法的原理和实现
PageRank是Google专有的算法,用于衡量特定网页相对于搜索引擎索引中的其他网页而言的重要程度图片来自网络,这里就根据这个图片的情况来实现PageRank算法这个图上有四个顶点,A,B,C,D,每个顶点对应一个网页。每个顶点都有若干条边,边的方向可能是指向别的顶点(当前网页的出链),也可能是别的顶点指向自己(当前网页的入链)PageRank算法会统计每个网页的入链数量,数量越多则网页越重要,那么在搜索网页的时候,重要的网页应该排在前面,更容易被搜索网页的人看到。但这样会有一个漏洞,那就是知
原创
2022-01-05 15:02:30 ·
2165 阅读 ·
0 评论