Proxmox救援指南
在网络环境中,各种故障时有发生,即使排除硬件和软件因素,人为因素也可能导致问题。一个深思熟虑的灾难恢复计划能在关键时刻发挥重要作用,快速的应急处理也能挽救局面。下面将介绍Proxmox可能遇到的一些故障及解决方法。
1. 从OS驱动器故障中恢复
OS驱动器故障会导致节点完全无法访问,但由于Proxmox将所有集群相关配置文件存储在Proxmox集群文件系统(pmxcfs)中,即使OS驱动器完全故障,集群数据也不会丢失。主要有两种类型的OS驱动器故障:
- 物理驱动器故障 :物理驱动器本身变得完全无法使用或有缺陷。这种情况下,唯一的选择是用新驱动器替换损坏的驱动器,并在上面安装全新的Proxmox VE。为防止因物理驱动器故障导致停机,可以在安装Proxmox时选择高级选项,在两个物理驱动器上创建ZFS镜像。也可以使用RAID卡并在两个物理驱动器上创建Raid 1来实现相同的RAID级冗余。
- OS数据损坏 :没有发生物理损坏,但OS的关键文件损坏,或OS的某些部分被意外删除。这可能是由于不完整的升级、更新或补丁中的错误,或者文件分区损坏导致的。大多数情况下,当出现文件系统错误或数据损坏时,OS启动过程会进入维护shell,也可以通过从Proxmox ISO CDROM重启节点并选择救援启动,手动进入Proxmox救援模式。
从故障节点迁移VM
根据OS驱动器故障的性质,停机时间会有所不同。如果修复时间超过可容忍的停机时间,可能需要在集群中的其他节点上启动之前由故障节点提供服务的VM。
- 当VM磁盘映像存储在共享存储节点上时,
超级会员免费看
订阅专栏 解锁全文
2817

被折叠的 条评论
为什么被折叠?



