CDH集群节点更换硬盘实施方案

最新推荐文章于 2022-12-29 15:35:02 发布

原创最新推荐文章于 2022-12-29 15:35:02 发布 · 6.3k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#CDH更换硬盘 #cloudera更换硬盘

cloudera manage 专栏收录该内容

2 篇文章

订阅专栏

本文介绍在CDH集群中遇到硬盘坏道时的处理流程。包括如何检测坏道硬盘、从集群中移除故障硬盘、刷新集群配置使数据均衡、更换硬盘并重新加入集群等步骤。

背景

因CDH数据交互比较频繁，硬盘的消耗较快，硬盘正常使用3年后容易出现硬盘坏道，为了避免硬盘坏道过多导致影响业务，经在测试环境中测试更换CDH集群节点硬盘后数据块未出现丢失现象。

实施步骤（测试环境node5节点进行测试）：
1. 查找异常硬盘挂载目录

目前是望京CDH平台node9的/dev/sdb1硬盘有坏道，所挂载的目录是/dfs/dn2

1. Web操作该节点去掉对应目录

进入node9节点的DataNode服务的配置界面去掉/dfs/dn2目录

1. 刷新集群（过期配置）

在刷新集群过程中dn2的数据块逐步向dn和dn1目录复制

在刷新集群过程中dn2的数据块逐步向dn和dn1目录复制

检测
1. 在数据平衡过程中可观察到数据块丢失比例在逐步减少

检测方法：hadoop fsck /

1. 平衡完成后数据块检测正常

1. 研发测确认是否有数据丢失
更换硬盘，web重新增加dn2目录
1. 更换新硬盘，重新挂载dn2目录后，dn2目录归属root权限，需调整为hdfs权限

chown hdfs.hadoop /dfs/ -R

1. 重新刷新集群（详见2.3）

1. 检查数据块是否有丢失

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。