客户云环境一台虚拟机,反馈重启不成功。经了解,客户环境使用的后端为ceph,故障虚拟机挂载一块云硬盘。
收集客户的nova-compute日志,发现报错如下:
libvirtError:internal error:process exited while connecting to monitor
如上图,日志显示云硬盘无法连接到ceph-mon,排查虚拟机所在的计算节点到ceph-mon的网络连接,从该计算节点telnet 10.20.4.5-7三个ceph-mon IP的6789端口,发现都是通的;排查计算节点到全部osd节点的ceph-public网络,发现链路也是通的。
另外日志信息里,file=rbd:SATA_APP_POOL/volume-xxxxx:id=volume:key=xxxx:auth_support=cephx,像是云硬盘无法连接ceph-mon.