计算Wikipedia的Pagerank值

该项目通过Java实现计算Wikipedia的Pagerank值,采用随机浏览模型,讨论了迭代计算的收敛问题和悬挂节点处理,通过PagerankCalculator类进行迭代更新,最终输出结果并展示了Pagerank值前10的Page。

第一次写优快云的博客,感觉它的xhEditor用的不是那么顺手,这篇文章是我们课程WBIA(Web Based Information Architecture)的一个作业,是直接从作业报告word粘贴过来的,粘贴的时候挺不顺的,首先图片粘贴不过来得自己上传加上,其次格式粘贴过来有一些地方有点小问题得改。不管怎么样第一次写优快云博客,希望大家多多包涵,有想要源码的在评论给我留言。

作业要求地址:http://net.pku.edu.cn/~wbia/2012Fall/project1.html,第一题Pagerank,本项目用Java实现。

1.项目要点阐述

1.1 Pagerank值计算公式

本项目采用随机浏览模型计算Pagerank值,公式如下:


其中d为按照超链进行浏览的概率,1-d即为用户随机跳转一个新网页的概率。这里Pagerank的初始值设为1,以保证每次进行迭代计算Pagerank值时总的Pagerank值不变。

1.2 迭代计算Pagerank的收敛问题

         Page页面的Pagerank迭代更新时,若更新前后新老Pagerank值小于一个指定的阈值则表示Pagerank页面收敛。本项目在实现时给定一个阈值MAX_PAGERANK_ERROR,若新老页面Pagera

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值