安装Hadoop完全分布式模式 (2012-03-27 10:06)
Hadoop完全分布式模式
目录
[隐藏]
|
- 系统 : centos 5.6
- JDK : jdk-6u26-linux-i586-rpm.bin
- 账号 : hadoop
- 目录 : /usr/local/hadoop
- 主机名 :master slave1 slave2
组建三台机器的群集
- master: 部署namecode,JobTracker,DataNode,TaskTracker
- slave1: 部署JobTracker,DataNode,TaskTracker
- slave2: 部署JobTracker,DataNode,TaskTracker
其实这个不是最好的组建方法。实验为了更好的测试多节点而这样设置。
安装- 请确保每台机器都安装了sun jdk 将hadoop安装在相同的目录(/usr/local/hadoop)。
- 请确保hadoop/conf/hadoop-env.sh 中JAVA_HOME=/usr/java/jdk1.6.0_26 设置并且正确。
- 每台机器创建hadoop账户。
- 确保master能无密码登录。
-
- 分发public key
- NameNode : core-site.xml
- JobTracker : mapred-site.xml
- DataNode : hdfs-site.xml
- master : masters
- slave : slaves
- 编辑namenode的配置文件
- 编辑JobTracker的配置
- 编辑DataNode配置
- 修改slave1,slave2的配置
- 修改slave1,slave2的JobTracker的配置
-
- 修改slave1,slave2的DataNode配置
- 设置master
- 设置slave
- 格式化namenode
- 启动所有进程
- 分布式文件系统测试
-
- 查看 http://master:50030 nodes里面是3证明三个节点正常接入
- 创建测试pustest文件夹用于分布式文件系统测试
-
- 将conf/hadoop-env.sh放到pushtest目录 用于测试。
-
- http://master:50070 Browse the filesystem 发现跳转slave1 or slave2 证明分布式文件系统正常。
- hadoop默认开放web状态展示访问地址为
- 简单的daemo