Fayson的github: https://github.com/fayson/cdhproject
推荐关注微信公众号:“Hadoop实操”,ID:gh_c4c535955d0f
1 问题复现
测试环境:
1.RedHat7.4
2.CM和CDH版本5.16.1
3.集群已启用Kerberos
在5.16.1集群中,启动NodeManager时失败,报错如下

出现该问题的原因是文件系统/var的挂载参数含有nosuid,nosuid防止可执行文件的setuid bit生效。从而造成setuid bit设置为“root”权限的二进制文件container-executor将无法访问属主为“root”的container-executor.cfg配置文件,从而导致上述错误。
2 问题解决
所有数据节点重新挂载/var目录,移除nosuid参数
cat /proc/mounts|grep var
mount -o remount, rw /var

修改配置文件/etc/fatab,将/dev/mapper/VolGroup-var行的nosuid删除

本文介绍了在CDH5.16.1集群中,由于/var目录挂载了nosuid参数,导致NodeManager启动失败的问题。 nosuid参数阻止了setuid bit生效,使得container-executor无法访问属主为“root”的配置文件,从而引发异常。解决方案是重新挂载/var目录,移除nosuid参数。
最低0.47元/天 解锁文章
1601

被折叠的 条评论
为什么被折叠?



