Hadoop 2.6.3动态增加/删除DataNode节点

最新推荐文章于 2019-06-16 20:29:39 发布

转载最新推荐文章于 2019-06-16 20:29:39 发布 · 188 阅读

Hadoop 专栏收录该内容

0 篇文章

订阅专栏

假设集群操作系统均为：CentOS 6.7 x64
Hadoop版本为：2.6.3

一、动态增加DataNode

1、准备新的DataNode节点机器，配置SSH互信，可以直接复制已有DataNode中.ssh目录中的authorized_keys和id_rsa
2、复制Hadoop运行目录、hdfs目录及tmp目录至新的DataNode
3、在新DataNode上启动hadoop

..sbin/hadoop-daemon.sh start datanode
..sbin/yarn-daemon.sh start datanode

4、在NameNode上刷新节点

..bin/hdfs dfsadmin -refreshNodes
..sbin/start-balancer.sh

5、为方便下次启动，可以将新DataNode的域名和ip加入/etc/hosts中

二、动态删除DataNode

1、配置NameNode的hdfs-site.xml，适当减小dfs.replication副本数，增加dfs.hosts.exclude配置

 <property>
    <name>dfs.hosts.exclude</name>
    <value>/usr/local/hadoop2/etc/hadoop/excludes</value>
 </property>

2、在对应路径（/etc/hadoop/）下新建excludes文件，并写入待删除DataNode的ip或域名
3、在NameNode上刷新所有DataNode

..bin/hdfs dfsadmin -refreshNodes
..sbin/start-balancer.sh

4、此时，可以在web检测界面（ip:50070）上可以观测到DataNode逐渐变为Dead。

作者：冰河
来源：优快云
原文：https://blog.youkuaiyun.com/l1028386804/article/details/78255746
版权声明：本文为博主原创文章，转载请附上博文链接！

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qccchagne

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

hadoop动态增删节点

慕铭yikm

11-08

2317

hadoop动态增删节点前提条件已经在虚拟机配置好三个hadoop集群，本次集群是根据以下博客配置，大家可以参考一下2021年全国行业职业技能竞赛暨第四届全国大学生大数据技能竞赛——职教学生组线上选拔赛资料链接链接：https://pan.baidu.com/s/1Q2Z-roUoGSMkXNf1I4dThA 提取码：yikm 主一从二增添节点新建虚拟机并配置好初始化环境时区同步和ntp同步：操作环境：slave3 tzselec..

Hadoop 2.X 动态添加 datanode(详细图文)

M_SIGNALs的博客

12-03

4113

准备工作：我们的三个节点的集群(master,slave1,slave2)已经安装成功并且启动，具体安装方法可以参照之前的一篇教程Hadoop-2.6.4集群安装(详细图文)。由于我们之前已经克隆出来一台，这次我们可以拿这一台来练习，先备份，搞崩了拿新的再搞！当然，大家也可以自己重新安装一台，然后要安装配置好 jdk，最好是跟之前安装的版本一致，免得出什么幺蛾子。

参与评论您还未登录，请先登录后发表或查看评论

hadoop删除节点

weixin_34409822的博客

01-08

285

今天在hadoop集群环境下需要将两台datanode删除，为了不影响在运行业务，需对节点进行动态删除，记录操作过程如下： 1，从集群中移走节点，需要对移走节点的数据进行备份：在主节点的core-site.xml配置文件中添加如下内容： <property> <name>dfs.hosts.exclude</name>...

hadoop集群——动态增加（删除）数据节点

晓风岚月

01-20

1218

一、环境准备（1）克隆一台虚拟机（2）修改ip地址和主机名称（3）修改xcall和xsync文件，增加新增节点的同步（4）删除原来HDFS文件系统留存的文件 /opt/module/hadoop-2.7.2/data 二、服役新节点具体步骤（1）在namenode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts文件...

hadoop动态增加和删除节点方法介绍

09-30

在Hadoop集群中增加新的DataNode节点，可以提高集群的数据存储和处理能力。以下是增加DataNode的步骤： 1. **准备新节点**：首先，确保新节点的操作系统与集群中的其他节点一致，例如CentOS 6.7 x64。安装相同版本...

winutils.exe_hadoop-2.6.3

09-18

- 如果你想在本地运行单节点模式，需要启动DataNode和NameNode进程。如果是在集群中，还需要启动ResourceManager、NodeManager和其他相关服务。总之，`winutils.exe_hadoop-2.6.3`是针对Windows用户的Hadoop 2.6.3...

hadoop-2.6.3.zip

09-28

1. **hadoop.dll**：这是一个动态链接库（DLL）文件，对于Windows平台上的Hadoop运行至关重要。DLL文件包含了一组函数调用，这些函数是Hadoop系统运行时所必需的。hadoop.dll可能包含了Hadoop的核心功能，如文件系统...

hadoop-2.6.3-bin.zip

09-12

7. **安装与配置**: 在Windows上使用Hadoop 2.6.3，用户需要配置环境变量，包括HADOOP_HOME、JAVA_HOME等，然后启动Hadoop的相关服务，如ResourceManager、NodeManager、DataNode等。 8. **应用场景**: Hadoop广泛...

Hadoop添加节点datanode(生产环境)

weixin_30258901的博客

06-30

180

Hadoop添加节点datanode 博客分类： hadoop HadoopSSHJDKXML工作 1.部署hadoop 和普通的datanode一样。安装jdk，ssh 2.修改host 和普通的datanode一样。添加namenode的ip 3.修改namenode的配置文件conf/slaves 添加新增节点的ip...

Ambari修改DataNode存储目录

01-20

操作背景： HDFS DataNode定义的存储目录不正确或HDFS的存储规划变化时，需要修改DataNode的存储目录，以保障HDFS的正常工作，假定我们现在对应的HDFS数据盘位置为：/hadoop/hdfs/data; 预将数据目录迁移至/data/hadoop/hdfs/data目录底下；目前操作系统受影响情况： 1）更改DataNode存储目录需要停止HDFS服务，在此期间集群无法正常对外提供服务 2）需要修改Ambari中HDFS中DataNode 对应的目录操作步骤： 1）切换到hdfs 用户 su – hdfs 2)在HDFS客户端下，执行命令，以检查HDFS根目录下全部

hadoop删除节点和添加节点

weixin_34249678的博客

08-05

147

从hadoop移除机器把需要移除的机器增加到exclueds文件中，强制刷新datanode列表，等待decommission 状态正常后，即可停机下架，如有必要在namenode执行balancer操作。操作命令：在master的conf/hdfs-site.xml中加入 <property> <name>dfs.ho...

Hadoop添加删除节点

02-13

262

添加节点 1.修改host 和普通的datanode一样。添加namenode的ip 2.修改namenode的配置文件conf/slaves 添加新增节点的ip或host 3.在新节点的机器上，启动服务 [root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start datanode[root@slave-004 h...

删减DataNode（decommissioning）与增加DataNode

hyy_blue的博客

06-16

2221

删减DataNode（decommissioning）有时你想讲Hadoop集群中的某个节点进行升级或者删除。当然你可以杀死节点从而让从集群剥离，但是非常不建议这么做，HDFS的设计非常有弹性的，让一两个节点离线不会影响操作的正常进行。NameNode会检测到节点的死亡，并开始复制那些低于预定的副本数的数据块，为了让操作更加的顺畅和安全，特别是删除大批DataNode时，应该使用Hadoop的退...

hadoop删除节点。

weixin_30650039的博客

11-26

196

hadoop节点摘除操作： 1、确定exclude文件的位置。 <property> <name>dfs.hosts.exclude</name> <value>/data/hadoop/conf/excludes</value> <description>Names a fil...

Hadoop删除节点（Decommissioning Nodes）

奔跑的羚羊

02-15

425

[b]1.集群配置[/b] 修改[b]conf/hdfs-site.xml[/b]文件 [code="xml"] dfs.hosts.exclude /data/soft/hadoop/conf/excludes Names a file that contains a list of hosts that are not permitted to connect...

创建hdfs namenode文件和datanode数据节点文件 mkdir -p /app /hadoop/hadoop_data/hdfs/namenode mkdir -p /app/local/hadoop/hadoop_data/hdfs/datanode 启动hadoop start-all.sh

最新发布

05-17

### 正确配置 HDFS 的 NameNode 和 DataNode 目录并启动 Hadoop 集群 #### 1. 配置 `hdfs-site.xml` 在 Hadoop 配置文件中，`hdfs-site.xml` 是用于定义 HDFS 名称节点 (NameNode) 和数据节点 (DataNode) 存储目录的关键文件。以下是推荐的配置方式： ```xml <configuration>  <property> <name>dfs.namenode.name.dir</name> <value>/data/hadoop/namenode</value> </property>  <property> <name>dfs.datanode.data.dir</name> <value>/data/hadoop/datanode</value> </property>  <property> <name>dfs.replication</name> <value>3</value> </property> </configuration> ``` 这里 `/data/hadoop/namenode` 和 `/data/hadoop/datanode` 是实际磁盘上的路径，可以根据实际情况调整[^1]。 --- #### 2. 格式化 NameNode 在首次启动 HDFS 前，需要对 NameNode 进行格式化操作。此操作会初始化 HDFS 文件系统的命名空间。执行以下命令完成格式化： ```bash $HADOOP_HOME/bin/hdfs namenode -format ``` 这一步会在 `dfs.namenode.name.dir` 指定的目录中创建必要的元数据文件[^1]。 --- #### 3. 启动 HDFS 使用以下命令启动 NameNode 和 DataNode： ```bash $HADOOP_HOME/sbin/start-dfs.sh ``` 可以使用 `jps` 命令查看当前 JVM 进程列表，确认 NameNode 和 DataNode 已经正常启动。如果一切顺利，应该能看到如下进程： - NameNode - DataNode - SecondaryNameNode 访问 Web 界面进一步验证 HDFS 是否正常工作： ``` http://<namenode-ip>:9870/ ``` 这里的端口 `9870` 是 Hadoop 2.x 及以上版本的标准端口号，旧版可能是 `50070`[^1]。 --- #### 4. 配置日志目录为了便于管理和排查问题，建议自定义 Hadoop 日志存储路径。编辑 `$HADOOP_HOME/etc/hadoop/hadoop-env.sh` 文件，添加或修改以下内容： ```bash export HADOOP_LOG_DIR=/var/log/hadoop ``` 这样可以将日志集中存放在 `/var/log/hadoop` 路径下，方便后续分析和维护[^2]。 --- #### 5. 启动 YARN 和 MapReduce YARN 是 Hadoop 的资源调度框架，MapReduce 则依赖于它运行计算任务。确保 `mapred-site.xml` 中有以下配置项： ```xml <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> ``` 接着启动 YARN 组件： ```bash $HADOOP_HOME/sbin/start-yarn.sh ``` 此时可以通过浏览器访问 YARN 的 Resource Manager 页面进行状态监控： ``` http://<resourcemanager-ip>:8088/ ``` 最后，尝试提交一个简单的 WordCount 测试程序以验证集群功能是否正常： ```bash $hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar wordcount \ hdfs://<namenode-host>:<port>/input hdfs://<namenode-host>:<port>/output ``` --- ### 总结通过合理配置 `hdfs-site.xml`、格式化 NameNode、启动 DFS 和 YARN，并测试基本作业流程，能够顺利完成 Hadoop 集群的基础搭建与调试。 ---