
Java && Java EE
文章平均质量分 82
sulliy
这个作者很懒,什么都没留下…
展开
-
Hadoop安装指南
安装环境OS:Ubuntu Linux 8.0Java:sun-java 1.6.0.20Hadoop:hadoop-0.20.2安装Hadoop之前需要做一些准备工作,系统应该先安装Java和SSH,并且保证sshd一直运行,以便使用Hadoop脚本管理器远端访问Hadoop守护进程。 第一步:安装SSH使用OpenSSH,在配置好源的情况下,输入如下命令:sud原创 2011-11-26 11:33:50 · 3473 阅读 · 0 评论 -
Hadoop源码解析-作业执行流程-集群模式
前面讲到在集群模式时,submitJob将调用JobTracker的submitJob。JobTracker.submitJob()启动一个新的Job。该函数内部创建一个JobInProgress对象,它包含JobProfile和JobStatus两个对象。JobProfile的成员是MapReduce的一些属性信息。String user; final JobID jobi原创 2011-12-02 23:48:47 · 2912 阅读 · 0 评论 -
酱油HADOOP 1
有很多介绍Hadoop的资源,Hadoop自动的Doc文件夹中也包含很多学习文档,有中文版的。http://www.cnblogs.com/wayne1017/archive/2007/03/18/668768.html 关于MapReduce的内容,建议看看孟岩的这篇MapReduce:The Free Lunch Is Not Over! import java.io.IOEx原创 2011-12-02 11:06:06 · 3227 阅读 · 0 评论 -
Hadoop源码解析-作业执行流程-本地模式
执行一个作业有很多方法,这看两种方法:1. JobClient.runJob(conf); //JobConf2. job.waitForCompletion(true);//JobrunJob接受一个作业配置对象JobConf,然后初始化一个JobClient,作业的提交最终有依靠该对象。 public static RunningJob runJob(JobConf job)原创 2011-12-02 17:12:10 · 3689 阅读 · 0 评论 -
PageRank的一个简单实现
public class PageRank { private BinaryData adjacencyMatrix = null; private double threshold = 0.000000001; private double alpha = 0.3; private double beta = 0.6; private double gamma = 0.1;原创 2011-12-28 14:22:51 · 2656 阅读 · 0 评论 -
Hadoop本地模式
如何安装和配置Hadoop已经有很多资料可以查了,官方文档http://hadoop.apache.org/common/docs/r0.19.2/cn/quickstart.html。但是还是经常会出一些问题。本地模式是推荐的开发模式,在Windows上配合Cygwin容易出错。Hadoop的三种模式:单机模式伪分布式模式完全分布式模式分布式模式增加了Na原创 2012-01-08 14:10:24 · 8741 阅读 · 1 评论