一、事故说明
最近出现了一次OCR盘的故障导致Oracle集群件宕机的事故,后以独占模式启动集群,并使用ocr备份恢复了OCR文件以及重新设置了vote disk,然后关闭集群,重启成功。
因此在此处进行事故重现以吸取教训。
二、重现步骤
测试RAC环境中只有+OCR和+DATA两个ASM磁盘组。
1.做好ocr的手工备份
当Oracle RAC集群的OCR盘出现故障时,可以通过利用$CRS_HOME的cdata目录下OCR的自动备份进行恢复。首先确认ASM参数文件备份,然后清除OCR磁盘头信息,强制关闭集群。接着以独占模式启动节点1的GRID组件,观察日志并等待ora.asm资源启动。在ASM实例启动后,创建新的+OCR盘并恢复OCR文件,设置新的votedisk。
一、事故说明

被折叠的 条评论
为什么被折叠?