【转】Hadoop datanode添加与删除

最新推荐文章于 2022-12-26 15:03:11 发布

原创最新推荐文章于 2022-12-26 15:03:11 发布 · 189 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#Hadoop

Hadoop 专栏收录该内容

16 篇文章

订阅专栏

本文介绍如何在Hadoop集群中实现节点的热拔插，包括添加新节点及移除旧节点的方法，并确保数据备份；同时讲解了通过运行balancer脚本来实现数据负载均衡的过程。

出处：http://zzhblog.sinaapp.com/?p=82

一、 Hadoop节点热拔插

在Hadoop集群中经常会进行增添节点操作，即实现节点的热拔插。在这些操作中不希望对集群进行重启。

2.在集群中添加节点：

a. 把新节点IP或者主机名字加入到主节点的slaves文件。

b. 登录到新节点，执行：

 cd
 $HADOOP_HOME

 bin
/hadoop-daemon
.sh start datanode

 bin
/hadoop-daemon
.sh start tasktracker

3. 从集群中移走节点，且对移走节点的数据进行备份：

a. 在主节点的core-site.xml配置文件中添加

<
property
>

  
<
name
>dfs.hosts.exclude</
name
>

  
<
value
>/usr/local/hadoop/conf/exclude</
value
>

  
<
description
>A base for other temporary directories.</
description
>

</
property
>

b. 在主节点的$HADOOP_HOME/conf/目录下新建文件excludes，每行为需要移走的节点，该例为s140。

c. 运行命令：

hadoop dfsadmin -refreshNodes

该命令可以动态刷新dfs.hosts和dfs.hosts.exclude配置，无需重启NameNode。此刻datanode消失了，但是tasktracker还存在。

d. 然后热行命令,查看状态

bin
/hadoop
 dfsadmin -report

Name: 192.168.3.140:50010

Decommission Status : Decommission in progress

Configured Capacity: 310716715008 (289.38 GB)

DFS Used: 59891990052 (55.78 GB)

Non DFS Used: 20663939548 (19.24 GB)

DFS Remaining: 230160785408(214.35 GB)

DFS Used%: 19.28%

DFS Remaining%: 74.07%

Last contact: Fri Aug 13 10:17:20 GMT+08:00 2010

Name: 192.168.3.136:50010

Decommission Status : Normal

Configured Capacity: 487925370880 (454.42 GB)

DFS Used: 101679245034 (94.7 GB)

Non DFS Used: 55873218838 (52.04 GB)

DFS Remaining: 330372907008(307.68 GB)

DFS Used%: 20.84%

DFS Remaining%: 67.71%

Last contact: Fri Aug 13 10:17:21 GMT+08:00 2010