
图算法
文章平均质量分 86
奔跑的蜗牛啊
这个作者很懒,什么都没留下…
展开
-
graphx之pregel模型
Pregel与图迭代pregel是graphx中图的分布式迭代模型,是graphx lib中ConnectedComponents、PageRank、LabelPropagation、StronglyConnectedComponents、ShortestPaths等算法基础。可以说没有pregel模型,graphx的魅力会大打折扣。接口那么graphx是如何实现Pregel迭代操作,我们应该如何使原创 2016-09-13 00:42:38 · 2398 阅读 · 0 评论 -
TriangleCount三角形计数
Graphx作为Spark的图计算组件,提供了丰富的图操作接口,以及6个常用的算法(在graphx lib中)。这里简单介绍下三角形计数TriangleCount算法原理;TriangleCount算法“统计每个顶点所在的三角形个数”。 关于三角形的定义,你一定不陌生。graphx是如何识别三角形,并做统计的呢 正如上图所示:每个顶点收集邻居点,如点1的邻居为(2,3,4),graphx中col原创 2016-09-11 21:03:56 · 13607 阅读 · 13 评论 -
graphx与完全图
三角形与3-完全图前面已介绍graphx如何统计三角形个数和发现三角形结构;三角形也是一种完全图(即任意图中两个点之间都有边)。为了方便下面诉述,这里将三角形称作3-完全图,而完全四边形称作4-完全图,依次类比4-完全图graphx并没有提供计算完全图的接口,即使发现简单的3-完全图/三角形也需要自己实现。但发现4-完全图,其实并没有那么困难,既然我们已经可以求解3-完全图,那么4-完全图应该是有办原创 2016-09-11 21:42:31 · 2619 阅读 · 0 评论 -
graphx之图迭代
迭代迭代思想是spark的精髓之一,所谓迭代,即每一步的输出结果作为下一步的输入,因而相邻迭代具有很强的关系。 graphx更是将这种迭代思想运用的灵活高效。联通分量通过graphx lib中的ConnectedComponents连通分量算法,简单介绍迭代和消息传播机制。示例见下图:在完成顶点的初始化后,连通分支开始迭代过程: 为区分顶点自身id与连通分支id,后者称作cid。 1. 发送消原创 2016-09-12 19:57:37 · 3429 阅读 · 0 评论 -
graphx解决图中心
图的中心点所谓图的中心点,就是到其他点的距离之和最小的点,可以将它近似看做图。如果将该点看作根节点,那么各层顶点到根节点的距离之和也是最小的。示例下图中的中心点是哪个呢?图中各点到其他点距离之和分别是{1-> 14, 2->14, 3->9, 4->8 , 5->13, 6->12, 7->12}。很明显到其他距离最小的点是4(距离之和为8),所以4是该图的中心点。 以4为根节点形成的最小生成树图原创 2016-09-15 16:27:25 · 3492 阅读 · 2 评论