本题是来自于:http://caibinbupt.iteye.com/blog/354316
题目是这样的:
有向图,输入是所有的边,如下图的输入是<A, B>,<A, C>,<A, D>,<A, E>,<B, C>,<B, F>,<E, D>和<C, G>,输出是图中所有这样三角形<x, <y,z>>,它的边是<x,y>,<x,z>和<y,z>。下面的图输出是<A, <B,C>>,<A, <E,D>>。用MapReduce做,不要用传统方法啦(比方说把边倒到数据库里,用SQL语句找)。

下面给出对应的解决方案以及源代码,解决方案和源代码来自于:hadoop解决一个图相关的题
解决方案:
要点就是中间结果需要附加一些信息,保证在解的过程中,上下文的信息是充分的。利用这种方法,我们还可以用MapReduce做图上的宽度优先搜索。

但是该博文中并没有给出算法的详细解说,所以我在这里将我的理解思路记录下来:
整个解决方案由两个mapred程序组成:
1)第一个mapred程序:map输入:图的所有边,输出:以边的起点作为key输出
red输入:具有相同起点的边,输出:从该起点能够到达的所有的其他点
red输入:key在小于等于2的步长下能够到达的所有点 ,输出:图中的三角形
使用MapReduce寻找图中三角形的算法解析

本文介绍了如何使用MapReduce解决寻找图中三角形的问题,不依赖于传统的方法如数据库和SQL。解决方案包含两个MapReduce程序,第一个程序以边的起点为key输出,第二个程序进一步处理以找到所有三角形。文中虽然没有提供详细的算法解说,但讨论了利用MapReduce进行图的宽度优先搜索的可能性。
2150

被折叠的 条评论
为什么被折叠?



