HDFS DataNode节点内磁盘平衡

转载已于 2022-04-15 00:45:57 修改 · 260 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：https://www.modb.pro/db/106350

文章标签：

#hadoop

于 2022-04-15 00:31:36 首次发布

hadoop 专栏收录该内容

26 篇文章

订阅专栏

本文介绍了在Apache HDFS框架下，如何修改配置文件hdfs-site.xml以实现磁盘平衡策略。作者参照Apache官方文档，将磁盘选择策略改为AvailableSpaceVolumeChoosingPolicy，并计划在实际操作后更新文章分享经验。

小数据运维之HDFS节点内平衡 - 墨天轮 (modb.pro)

这里我还需要补充一点，上方链接的文章中采用的是CDH框架，那么我使用的是Apache框架，所以磁盘平衡算法配置还需要在hdfs-site.xml中更改

以下是我参照Apache官方文档修改的平衡算法配置

<property>
	<name>dfs.datanode.fsdataset.volume.choosing.policy</name>
 <value>org.apache.hadoop.hdfs.server.datanode.fsdataset.AvailableSpaceVolumeChoosingPolicy</value>
</property>

待我真正实践过该机制后再来更新此文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AdamShyly

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

如何对HDFS进行节点内(磁盘间)数据平衡

萌兔兔MMQ！！

08-15

1981

在CDP7中，因为是Hadoop3，默认就支持磁盘间数据均衡，本文档主要介绍在CDP中如何进行HDFS磁盘扩容并在节点内进行Balancer。特别是这种情况：当DataNode原来是挂载了几个数据盘，当磁盘占用率很高之后，再挂载新的数据盘。由于Hadoop 2.x 版本并不支持HDFS的磁盘间数据均衡，因此，会造成老数据磁盘占用率很高，新挂载的数据盘几乎很空。在这种情况下，挂载新的数据盘就失去了扩容HDFS数据盘的意义。磁盘平衡执行计划生成的文件内容格式是Json的，并且存储在HDFS之上。...

Hadoop集群datanode磁盘不均衡的解决方案

02-25

Hadoop的HDFS集群非常容易出现机器与机器之间磁盘利用率不平衡的情况，比如集群中添加新的数据节点，节点与节点之间磁盘大小不一样等等。当hdfs出现不平衡状况的时候，将引发很多问题，比如MR程序无法很好地利用本地计算的优势，机器之间无法达到更好的网络带宽使用率，机器磁盘无法利用等等。因业务需要搭建一个新hadoop集群，并将老的hadoop集群中的数据迁移至新的hadoop集群，而且datanode节点不能全部上线，其中还可能会出现节点上线或下线的情况，这个时候就很容易出现机器与机器之间磁盘的均衡的情况，具体如下：上图中可以看出max是94.18%，而min是0.37%，其中有600多台是

参与评论您还未登录，请先登录后发表或查看评论

HDFS-Datanode磁盘选择策略分析

breakout_alex的博客

04-09

2223

概述 Hadoop技术体系中，hdfs是重要的技术之一，而真实的数据都存储在datanode节点之上，DataNode 将数据块存储到本地文件系统目录中，而每个datanode节点可以配置多个存储目录（可以是不同类型的数据硬盘），hdfs-site.xml （dfs.datanode.data.dir参数）。一般的hadoop集群datanode节点会配置多块数据盘，当我们往HDFS上...

hadoop2.0的datanode多目录数据副本存放策略

快乐程序员的专栏

10-11

8909

在hadoop2.0中，datanode数据副本存放磁盘选择策略有两种方式：第一种是沿用hadoop1.0的磁盘目录轮询方式，实现类：RoundRobinVolumeChoosingPolicy.java 第二种是选择可用空间足够多的磁盘方式存储，实现类：AvailableSpaceVolumeChoosingPolicy.java

HDFS教程（05）- HDFS磁盘均衡

阿甘兄

02-23

2065

文章目录01 引言02 HDFS磁盘均衡2.1 为何需要磁盘均衡？2.2 磁盘均衡原理2.3 磁盘均衡的使用03 文末 01 引言在前面的教程，我们知道了HDFS的联邦机制了，有兴趣的同学可以参阅：《HDFS教程（01）- 初识HDFS》《HDFS教程（02）- HDFS命令汇总》《HDFS教程（03）- HDFS高可用与容错》《HDFS教程（04）- HDFS联邦》本文接下来主要讲的是HDFS的磁盘均衡。 02 HDFS磁盘均衡 2.1 为何需要磁盘均衡？在把数据存储到 Datanode

如何平衡HDFS中的DataNode存储？

cuma2369的博客

07-26

343

As nodes are added and deleted in a Hadoop cluster. Storage usage across DataNodes may be different. Some DataNodes’ disks are almost used up while some others’ are almost empty. 在Hadoop群集中添加和删除节点时。跨...

绝对完美解决hdfs datanode数据和磁盘数据分布不均调整（hdfs balancer ）——经验总结

赵英超的博客

02-04

3080

hdfs 需要存写大量文件，有时磁盘会成为整个集群的性能瓶颈，所以需要优化 hdfs 存取速度，将数据目录配置多磁盘，既可以提高并发存取的速度，还可以解决一块磁盘空间不够的问题。大数据Hadoop之——Hadoop 3.3.4 HA（高可用）原理与实现（QJM）

绝对完美解决hdfs datanode数据和磁盘数据分布不均调整（hdfs balancer ）——经验总结_datanode balance

2401_84586524的博客

05-12

1112

绝对完美解决hdfs datanode数据和磁盘数据分布不均调整（hdfs balancer ）——经验总结_datanode balance(2)

2401_84586524的博客

05-12

592

hdfs 需要存写大量文件，有时磁盘会成为整个集群的性能瓶颈，所以需要，将数据目录配置多磁盘，既可以提高并发存取的速度，还可以。

hadoop几个datanode机器间小范围的数据负载均衡

forrest420的专栏

08-27

354

# 获得集群当前datanode间负载均衡可以使用的带宽，单位为byte，当前为1Mb hdfs getconf -confKey dfs.datanode.balance.bandwidthPerSec 1048576 #改为100Mb hdfs dfsadmin -setBalancerBandwidth 104857600 集群平衡的条件，datanode间磁盘使用率相差阈值，区间选择：0~100 。默认为10，调整为20，加速平衡过程结束 hdfs balancer -th.

Hadoop节点的磁盘RAID

ichimaruginskb的博客

03-28

5560

当搭建hadoop集群的时候首先要注意的是节点的磁盘选型，这对hadoop集群的读写和高可用有着很重要的影响以下是对Hadoop集群节点的磁盘配置建议： HDFS NameNode作为重要的节点，其元数据存储区必须是磁盘阵列，最好做Raid-1(RAID-5需要至少3块硬盘） DataNode不要做Raid，因为在HDFS的软件层面提供了数据的冗余，而且如果磁盘阵列出现问题可能会导致整个节点不可用，

浅析Hadoop 之 HDFS 的磁盘配置（包含读写策略）

Yannick Jiang 的专栏

07-11

4728

一、前言:玩个Hadoop 简单配置的同学都知道core-site.xml 和 hdfs-site.xml里有配置 tmp 数据的目录和实际数据 data 的目录，那么这些目录在真正任务运行时，磁盘（集群下每个Node多块磁盘时）读写策略是怎么选择的呢？二、相关概念介绍：1. core-site.xml里配置临时数据存放的目录，也可以是临时运行的目录hadoop.tmp.dir /tmp...

Hadoop-3.X优化参数

docsz的博客

04-25

582

Hadoop-3.X优化参数

hadoop 文件存放策略_【知识讲解篇-15】HDFS的数据副本存放磁盘选择策略

weixin_39755218的博客

12-23

535

dfs.datanode.data.dir 配置数据存放的路径在 HDFS 中，DataNode 将数据块存储到本地文件系统目录中，具体的目录可以通过配置 hdfs-site.xml 里面的 dfs.datanode.data.dir 参数。在典型的安装配置中，一般都会配置多个目录，并且把这些目录分别配置到不同的设备上，比如分别配置到不同的HDD(HDD的全称是Hard Disk Drive)和S...

hadoop2.0的datanode多存储硬盘设置数据副本存放策略

TURING.DT

09-13

3898

集群使用4块硬盘，目前集群中部分节点盘disk1使用率已经超90%，后期可能会出现问题。在hadoop2.0中，datanode数据副本存放磁盘选择策略有两种方式：第一种是沿用hadoop1.0的磁盘目录轮询方式，实现类：RoundRobinVolumeChoosingPolicy.java 第二种是选择可用空间足够多的磁盘方式存储，实现类：AvailableSpaceVolumeCho

hadoop 源码解析-Node启动流程：

专注Java（全栈）应用开发，求知若渴，虚心若愚，talk is cheap, show me the code.

06-05

331

hadoop 源码分析 1.启动Name节点： public static void main(String argv[]) throws Exception { if (DFSUtil.parseHelpArgument(argv, NameNode.USAGE, System.out, true)) { System.exit(0); } try { StringUtils.startupShutdownMessage(NameNode.class, argv, LOG); // 创建 NameNode

HDFS块预留导致的存储空间异常的问题探究

小昌昌的博客

01-04

1240

HDFS的块预留策略(blocksScheduled)在特定的写入异常情况下，会让NameNode错误判断DataNode的剩余可用存储空间，最终导致DataNode在存储空间足够的情况下也不再被NameNode调度。本文对该问题的发现过程、诊断过程、原理进行了探究和讨论，重在展现分布式系统debug过程中应有的习惯、思维方式、常用手段等。

大数据Hadoop之——Hadoop HDFS多目录磁盘扩展与数据平衡实战操作

匠人精神，持之以恒！

08-21

3286

HDFS 副本存放磁盘选择策略详解

MY BLOG

12-17

1261

在 HDFS 中，DataNode 将数据块存储到本地文件系统目录中，具体的目录可以通过配置 hdfs-site.xml 里面的 dfs.datanode.data.dir 参数。在典型的安装配置中，一般都会配置多个目录，并且把这些目录分别配置到不同的设备上，比如分别配置到不同的HDD（HDD的全称是Hard Disk Drive）和SSD（全称Solid State Drives，就是我们熟悉的固态硬盘）上。当我们往 HDFS 上写入新的数据块，DataNode 将会使用 volume 选择策略来为这

hdfs datanode没有启动

最新发布

05-18

### HDFS DataNode未启动的解决方案当HDFS中的DataNode未能成功启动时，通常是因为配置错误、文件不一致或其他环境问题引起的。以下是几种常见的原因及其对应的解决方案： #### 1. **Cluster ID不匹配** 如果在初始化过程中仅格式化了NameNode而未同步更新DataNode的`clusterID`，可能导致两者之间的`clusterID`不一致，进而阻止DataNode正常启动。解决方法是通过以下步骤修复： - 查看当前NameNode和DataNode的日志文件，确认是否存在`Incompatible ClusterIDs`的相关报错信息。 - 手动修改所有DataNode上的`current`目录下的`VERSION`文件中的`clusterID`字段，使其与NameNode保持一致[^2]。或者采用更简单的办法——删除所有DataNode上的数据目录并重新启动集群。 --- #### 2. **清理旧的数据目录** 当NameNode被重新格式化后，原有的DataNode数据会变得过期或不再兼容新版本的元数据结构。此时需要清空DataNode的数据目录再尝试启动。步骤如下： - 停止所有Hadoop服务： ```bash bigdata/hadoop/sbin/stop-all.sh ``` - 定位到DataNode的数据路径（可通过`hdfs-site.xml`查找）： ```xml <property> <name>dfs.datanode.data.dir</name> <value>/path/to/datanode/data</value> </property> ``` - 删除对应路径下的`current`目录： ```bash rm -rf /path/to/datanode/data/current/ ``` - 启动Hadoop服务： ```bash sbin/start-dfs.sh ``` 这种方式适用于开发测试环境中，生产环境下需谨慎操作以免造成不可逆的数据损失[^5]。 --- #### 3. **完全重新格式化集群** 若以上两种方法均无法解决问题，则可以选择彻底重新格式化整个HDFS集群。此过程将重置所有的`clusterID`，但也会清除现有数据，因此只建议用于尚未正式投入使用的集群。操作流程包括： - 停止所有HDFS相关服务； - 在NameNode执行格式化命令： ```bash hdfs namenode -format ``` - 清理各DataNode上的数据目录； - 最终重启全部组件以验证是否恢复正常工作状态[^3]。 --- #### 4. **检查日志文件定位具体异常** 数据节点失败的原因也可能隐藏于详细的日志记录之中。可以通过阅读位于`${HADOOP_LOG_DIR}`内的logs来获取更多线索，特别是关注是否有磁盘空间不足、权限设置不当或者网络连接超时等问题存在。 --- ```python # 示例Python脚本辅助自动化部分任务 import os def clear_dfs_data(dfs_dir): """Clear the DFS data directory.""" try: os.system(f'rm -rf {dfs_dir}/current/') print('Data cleared successfully.') except Exception as e: print(f'Error occurred while clearing data: {e}') if __name__ == "__main__": dfs_path = '/opt/soft/hadoop313/data/dfs/data' clear_dfs_data(dfs_path) ``` --- ### 总结针对HDFS DataNode无法启动的情况，应优先排查`clusterID`一致性问题；其次考虑清理陈旧数据目录；必要情况下才采取全面重建措施。每一步都应当仔细核对参数配置及实际运行状况，确保最终能够顺利恢复服务功能[^1]^。