7、大规模图处理系统PEGASUS:原理、实现与应用

大规模图处理系统PEGASUS:原理、实现与应用

1. 引言

如今,图数据的规模极其庞大。以在线服务为例,网络图谱的链接至少有1万亿条;Facebook有超10亿用户和1400亿条好友关系;2009年Twitter有超4000万用户和15亿条社交关系。海量数据带来了新机遇和好处,但也带来了计算挑战,像社区检测、寻找连通分量、计算PageRank及其变体、最短路径和半径计算等常见图计算任务,在处理大规模图数据时变得极具挑战性。

PEGASUS是一个开源的Peta图挖掘库,可执行典型图挖掘任务,如计算图的直径、每个节点的半径、寻找连通分量以及计算节点的重要性得分。其核心思想是将矩阵 - 向量乘法作为软件工程师的主要操作原语。它受相关研究启发,引入了一组不同的运算符,结合MapReduce中矩阵 - 向量乘法的优化实现,解决了各种图挖掘任务。自PEGASUS推出后,也出现了其他大规模图处理系统,如Google的Pregel、LinkedIn的Giraph和GraphLab等,其中Giraph还采用了PEGASUS的一些算法和思想。

2. 相关工作
2.1 现实世界网络的结构
  • 网络图谱的蝴蝶结结构 :1999年,Andrei Broder等人以强连通分量(SCCs)为基础对网络图谱进行研究,提出了蝴蝶结模型。该模型指出存在一个单一的巨型SCC,其余SCCs相对于巨型SCC的位置分为:IN(能到达巨型SCC但不能从其到达的顶点)、OUT(能从巨型SCC到达但不能到达它的顶点)、Tendrils(能从IN到达但不能到达巨型SCC,或能到达OUT但不能从巨型SCC到达的顶点)、Disconnec
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值