【背景】
因为下周要对大数据开放式平台的服务器进行机房搬迁,开放式平台有90台物理机,其中24台服务器是后来扩容新增的,ip段为19.126.66.*,与另外一个集群共用了同一个网段。根据机房的物理部署规划,搬迁是要对同一个网段批量进行的,因此在搬迁前需要对这24台服务器的ip进行修改。
修改ip的变更本周四实施,因此今天在测试环境进行方案验证,对一台计算节点进行ip修改。源ip:146.32.19.25,目标ip:146.32.18.100
【零、CM上停止该节点角色】
【一、修改ip配置文件】
将老的ip配置文件移动到/tmp目录下
d0305001:/etc/sysconfig/network # cat ifcfg-vlan119
BOOTPROTO='static'
BROADCAST=''
ETHERDEVICE='bond0'
ETHTOOL_OPTIONS=''
IPADDR='146.32.19.25/24'
MTU=''
NAME=''
NETWORK=''
REMOTE_IPADDR=''
STARTMODE='auto'
USERCONTROL='no'
VLAN_ID='119'
d0305001:/etc/sysconfig/network # mv ifcfg-vlan119 /tmp/
新建ip配置文件ifcfg-vlan118
d0305001:/etc/sysconfig/network # cat ifcfg-vlan118
BOOTPROTO='static'
BROADCAST=''
ETHERDEVICE='bond0'
ETHTOOL_OPTIONS=''
IPADDR='146.32.18.100/24'
MTU=''
NAME=''
NETWORK=''
REMOTE_IPADDR=''
STARTMODE='auto'
USERCONTROL='no'
VLAN_ID='118'
【二、修改路由配置文件】
d0305001:/etc/sysconfig/network # vi routes
default 146.32.19.254 - -
修改为
default 146.32.18.254 - -
【三、重启网络服务】
service network restart
d0305001:/etc/sysconfig/network # ip a|grep global
inet 146.32.18.100/24 brd 146.32.18.255 scope global vlan118
inet 146.33.18.100/24 brd 146.33.18.255 scope global vlan218
【四、修改ntp配置】
修改/etc/ntp.conf文件中的146.32.19.254网关地址为新ip对应的网关146.32.18.254,并重启ntp服务
d0305001:/etc/sysconfig/network # service ntp restart
Shutting down network time protocol daemon (NTPD) done
Starting network time protocol daemon (NTPD) done
【五、修改整个集群、客户端的/etc/hosts文件】
cp /etc/hosts /etc/hosts.0107
sed -i 's/19.25/18.100/g' /etc/hosts
【六、重启该节点agent服务】
service cloudera-scm-agent restart
cm上启动该节点角色
【七、验证】
该节点角色服务启动后,报错失去namenode连接
查看日志:Datanode denied communication with namenode because the host is not in the include-list: DatanodeRegistration(146.32.18.100……
d0305001:/var/log/hadoop-hdfs # tail -100 hadoop-cmf-hdfs-DATANODE-d0305001.log.out
at javax.security.auth.Subject.doAs(Subject.java:415)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1714)
at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2135)
2019-01-07 10:50:21,141 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: Block pool BP-1060838331-146.249.31.13-1489136106065 (Datanode Uuid 5538360a-f138-42f2-b219-2b4993c6d

本文介绍了一个HDFS集群中更改节点IP地址的过程及遇到的问题。具体包括修改IP配置文件、重启网络服务、更新集群配置等步骤。在完成IP变更后,发现无法与NameNode建立连接并进行了故障排查与解决。
最低0.47元/天 解锁文章
1820

被折叠的 条评论
为什么被折叠?



