前言:cdp集群装了Kerberos认证,在进行权限集成时集群所有组件高可用状态失效,yarn组件ResourceManager停止
查看ResourceManager组件日志,报错如下:
Error starting ResourceManager
org.apache.hadoop.service.ServiceStateException: org.apache.zookeeper.KeeperException$NoAuthException: KeeperErrorCode = NoAuth for /rmstore/ZKRMStateRoot
初步分析,怀疑可能和zookeeper有关
查看zookeeper组件状态,三个节点一切正常
查看zookeeper日志,所有节点日志统一输出
Submitting global closeSession request for session 0x10005e3ff990515
这看着肯定有问题,估计是权限啥的
问问万能的chatgpt,怎么回答的:
ResourceManager 在启动过程中遇到了 Zookeeper 认证权限的问题。具体来说,出现了 “NoAuthException: KeeperErrorCode = NoAuth for /rmstore/ZKRMStateRoot”。
关于zookeeper上面的报错,我把连接指定ip了
[zk: localhost:2181(CONNECTED) 9] getAcl /