本题是来自于:http://caibinbupt.iteye.com/blog/354316
题目是这样的:
有向图,输入是所有的边,如下图的输入是<A, B>,<A, C>,<A, D>,<A, E>,<B, C>,<B, F>,<E, D>和<C, G>,输出是图中所有这样三角形<x, <y,z>>,它的边是<x,y>,<x,z>和<y,z>。下面的图输出是<A, <B,C>>,<A, <E,D>>。用MapReduce做,不要用传统方法啦(比方说把边倒到数据库里,用SQL语句找)。
下面给出对应的解决方案以及源代码,解决方案和源代码来自于:hadoop解决一个图相关的题
解决方案:
要点就是中间结果需要附加一些信息,保证在解的过程中,上下文的信息是充分的。利用这种方法,我们还可以用MapReduce做图上的宽度优先搜索。
但是该博文中并没有给出算法的详细解说,所以我在这里将我的理解思路记录下来:
整个解决方案由两个mapred程序组成:
1)第一个mapred程序:map输入:图的所有边,输出:以边的起点作为key输出
red输入:具有相同起点的边,输出:从该起点能够到达的所有的其他点

red输入:key在小于等于2的步长下能够到达的所有点 ,输出:图中的三角形
