Open-Stack 集群大了以后,内存出错,磁盘出错的事情出现的次数也会增加,下面就是一个例子。
运维在重启一台Hypervisor (HV) 后,碰到 input, output 错误:
root@production-m1:~# virsh
-su: /usr/bin/virsh: Input/output error
root@production-m1:~#
第一步: 检查 libvirt 是不是在运行
ps aux | grep libvirt
结果 libvirtd 在运行
第二步: 尝试重启 libvirtd
root@production-m1:~# service libvirtd restart
-su: /usr/sbin/service: Input/output error
第三部: 查看磁盘挂载情况
root@production-m1:~# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda2 9.4G 1.9G 7.2G 21% /
udev 126G 4.0K 126G 1% /dev
tmpfs 51G 288K 51G 1% /run
none 5.0M 0 5.0M 0% /run/lock
n

在大规模OpenStack集群中,运维人员遇到Hypervisor重启后的输入/输出错误。经过检查磁盘挂载、系统日志和磁盘阵列健康状况,最终通过重启解决了问题。建议在生产环境中,面对磁盘错误时,先检查磁盘阵列而非直接运行fsck。
最低0.47元/天 解锁文章
2281

被折叠的 条评论
为什么被折叠?



