环境配置
Hadoop配置
这里使用Hadoop2.5.1进行配置,可以参考这里。
查看版本号

运行Hadoop
./hadoop-2.5.1/sbin/start-dfs.sh
查看是否成功

Giraph配置
下载Giraph
cd /usr/local
sudo git clone https://github.com/apache/giraph.git
sudo chown -R hadoop:hadoop giraph
编译
cd giraph
mvn -Phadoop_2 -Dhadoop.version=2.5.1 -DskipTests clean package
编译成功:

运行
执行最短路径程序
输入
创建/tmp/tiny_graph.txt,输入:
[0,0,[[1,1],[3,3]]]
[1,0,[[0,1],[2,2],[3,1]]]
[2,0,[[1,2],[4,4]]]
[3,0,[[0,3],[1,1],[4,4]]]
[4,0,[[3,4],[2,4]]]
每一条线由[source_id,source_value,[[dest_id, edge_value],...]]构成。
并拷贝到HDFS中:
cd /usr/local
hadoop-2.5.1/bin/hadoop dfs -copyFromLocal /tmp/tiny_graph.txt /tiny_graph.txt

提交任务
/usr/local/hadoop-2.5.1/bin/hadoop jar /usr/local/giraph/giraph-examples/target/giraph-examples-1.3.0-SNAPSHOT-for-hadoop-2.5.1-jar-with-dependencies.jar org.apache.giraph.GiraphRunner org.apache.giraph.examples.SimpleShortestPathsComputation -vif org.apache.giraph.io.formats.JsonLongDoubleFloatDoubleVertexInputFormat -vip /tiny_graph.txt -vof org.apache.giraph.io.formats.IdWithValueTextOutputFormat -op /shortestpaths -w 1 -ca giraph.SplitMasterWorker=false
查看结果

每个点离点1的最短路径:

查看代码例子
package org.apache.giraph.examples;
import org.apache.giraph.graph.BasicComputation;
import org.apache.giraph.conf.LongConfOption;
import org.apache.giraph.edge.Edge;

本文介绍了如何在Hadoop2.5.1环境下配置Giraph,包括下载、编译和运行最短路径程序。详细步骤包括运行Hadoop,提交任务到HDFS,以及查看计算结果。Giraph的计算核心涉及`compute`和`sendMessage`两个关键函数。
最低0.47元/天 解锁文章
584

被折叠的 条评论
为什么被折叠?



