在Hadoop集群中添加机器和删除机器

最新推荐文章于 2024-10-09 11:36:28 发布

wangchangtao

最新推荐文章于 2024-10-09 11:36:28 发布

阅读量161

点赞数

CC 4.0 BY-SA版权

分类专栏： Hadoop 文章标签： hadoop

本文链接：https://blog.youkuaiyun.com/wangchangtao/article/details/84226180

Hadoop 专栏收录该内容

2 篇文章

订阅专栏

本文介绍在Hadoop集群中安全地添加和删除节点的方法。添加节点只需修改配置文件并重启服务；删除节点则需通过排除列表及刷新节点配置来实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

无论是在Hadoop集群中添加机器和删除机器，都无需停机，整个服务不中断。

[b]添加机器[/b]
在集群的Master机器中，修改$HADOOP_HOME/conf/slaves文件，在其中添加需要加入集群的新机器（newHost）的主机名：

newHost
hp2

然后在Master机器中执行如下命令：
$HADOOP_HOME/bin/start-all.sh
这样操作完成之后，新的机器就添加到集群中来了。

[b]删除机器[/b]
不安全的方式
由于Hadoop集群自身具备良好的容错性，可以直接关闭相应的机器，从而达到将该机器撤除的目的。但是如果一次性操作3台以上的机器，就有可能造成部分数据丢失，所以不推荐使用这种方式进行操作。

安全的方式
在集群的Master机器中，新建一个文件：$HADOOP_HOME/conf/nn-excluded-list，在这个文件中指定需要删除的机器主机名（hp3）：

hp3

然后，修改Master机器的配置文件：$HADOOP_HOME/conf/hdfs-site.xml，添加如下内容：

<property>

<name>dfs.hosts.exclude</name>

<value>conf/nn-excluded-list</value>

</property>

最后，在Master机器中执行如下命令：

$HADOOP_HOME/bin/hadoop dfsadmin -refreshNodes

这样操作完成之后，可以在HDFS集群中看到，hp3机器已经处于Decommission In Progress状态：
我们需要等待一定的时间，等待hp3中datanode的Decommission操作完成以后，再到hp3机器中关闭所有的Hadoop进程即可。

这样就完成了整个从集群中删除机器的操作。