hadoop集群安装

最新推荐文章于 2025-04-11 00:20:04 发布

原创最新推荐文章于 2025-04-11 00:20:04 发布 · 284 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

hadoop 专栏收录该内容

14 篇文章

订阅专栏

通过创建多个虚拟机来模拟实现hadoop的集群安装。现创建了三个虚拟机，主机名分别为hadoop0,hadoop1,hadoop2。现选中hadoop0作为集群主节点，hadoop1、hadoop2作为从节点。在hadoop0上运行Java进程NameNode、JobTracker、SecondaryNameNode(可以放到从节点上运行)，从节点(hadoop1、hadoop2)运行Java进程DataNode、TaskTracker。

现默认hadoop0上已安装好了jdk、hadoop。如果还没安装，请看hadoop伪分布环境搭建

hadoop集群安装过程如下：

1. 编辑各节点的/etc/hosts，在该文件中包含所有节点的ip与hostname的映射信息

2. 两两节点的SSH免密码登录:

1) 在各个节点实现免密码登录(参考hadoop伪分布环境搭建)

2) 在hadoop0节点上获取hadoop1公钥:ssh-copy-id -i hadoop1,获取hadoop2公钥:ssh-copy-id -i hadoop2

3) 在hadoop0节点上发送所有节点公钥集合最大文件：scp /root/.ssh/authorized_keys hadoop1:/root/.ssh/

4) 验证两两节点是否免密码登录:ssh hadoop0、ssh hadoop1、ssh hadoop2

3. 把hadoop0的hadoop目录下的logs和tmp删除

4. 把hadoop0的jdk、hadoop文件夹复制到hadoop1和hadoop2节点上：scp -r /usr/local/ jdk hadoop1:/usr/local/。同理hadoop2

5. 把hadoop0的/etc/profile复制到hadoop1和hadoop2节点上，在各个节点上执行命令source /etc/profile

6. 编辑hadoop0的配置文件slaves,改为从节点的hostname，分别是hadoop1和hadoop2。各占一行

7. 在hadoop0节点执行start-all.sh，进行格式化

8. 启动，在hadoop0节点执行start-all.sh

9. 验证：hadoop0上运行Java进程NameNode、JobTracker、SecondaryNameNode，从节点(hadoop1、hadoop2)运行Java进程DataNode、TaskTracker。

注意：对于配置文件core-site.xml和mapred-site.xml在所有节点中都是相同的内容

扩展：

1.SecondaryNameNode运行过程中很占用内存，因为它要合并fsimage(NameNode元记录)和edit(事务操作记录日志)文件，单独布置到一台机器上，在hadoop0的conf文件夹下的master文件中，指定机器hostname

2.动态的增加一个hadoop节点

2.1 把主节点的jdk、hadoop、/etc/profile文件发送到新节点中

2.2 设置新节点自身免密码登录、集群两两节点免密码登录

2.3 把新节点的hostname布置到主节点的slaves文件

2.4 在新节点启动进程：hadoop-daemon.sh start datanode hadoop-daemon.sh start tasktracker

2.5 在主节点执行脚本 hadoop dfsadmin -refreshNodes

2.6 均衡block(在新节点上执行，如果有多个新节点，只需在一个节点):start-balancer.sh

3.hadoop安全模式:当刚启动hadoop的前30秒是安全模式，在该模式下只能对hdfs下的文件进行查看，不能增删改。当block缺失率达不到hadoop设置的要求后，系统会自动进入到安全模式。经常用到的命令有hadoop dfsadmin -safemode enter | leave | get | wait(可能还有其他的)

小冷在努力

博客等级

码龄11年

137
原创

53
点赞

162
收藏

38
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: hadoop基础理论知识

下一篇：: HDFS学习总结

最新评论

Quartz定时器入门总结
qq_34715667: mark
Quartz定时器入门总结
xmind果果: 就凭这个爱情动作片，这个任务调度学定了，坐等资源
Quartz定时器入门总结
qq_15180891: henbucuo
codeforce 之 Red-Green Towers
小冷在努力回复 AC_XXZ: 这里用到的是滚动数组，如果是二维数组，会超内存。但是用二维数组来理解滚动数组容易理解，所以就用了二维数组来解释了。题意要求是要用red和green，当用J个红积木来堆叠I层，当着J个红积木堆叠好后，未堆叠的层次就需要green积木来堆叠饿了，那么这J个红积木可以堆叠这H层的任意一层或者几层，所以这就有了DP[I][J]种堆叠，现在你已经求出来了用J-I个红积木来堆叠I-1层，即DP[I-1][J-I]，现在要求再加一层，如果定义从下往上层数为1到H，可以理解要加的这一层是第一层，就是这一层要加I个红积木，而这只有一种可能，所以DP[I][J]+=DP[I-1][J-I]。这是我的个人理解。
codeforce 之 Red-Green Towers
小冷在努力: 这里用到的是滚动数组，如果是二维数组，会超内存。但是用二维数组来理解滚动数组容易理解，所以就用了二维数组来解释了。题意要求是要用red和green，当用J个红积木来堆叠I层，当着J个红积木堆叠好后，未堆叠的层次就需要green积木来堆叠饿了，那么这J个红积木可以堆叠这H层的任意一层或者几层，所以这就有了DP[I][J]种堆叠，现在你已经求出来了用J-I个红积木来堆叠I-1层，即DP[I-1][J-I]，现在要求再加一层，如果定义从下往上层数为1到H，可以理解要加的这一层是第一层，就是这一层要加I个红积木，而这只有一种可能，所以DP[I][J]+=DP[I-1][J-I]。这是我的个人理解。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。