12C RAC环境节点宕机问题

本文记录了一次4节点RAC集群中两个节点无法启动的问题处理过程。由于目录权限被不当修改,导致集群服务启动失败。通过恢复正确的目录权限设置解决了问题。

接到用户报障,4节点RAC中有两个节点一个月前就无法正常启动。

一、问题现象

1、现场检查发现4个节点服务器中有两台(node2,node4)处于离线状态。
2、在node2 和node4上检查发现无crs相关进程,oracle crs未启动。
3、在node2和node4使用root 执行crsctl start has时无法启动成功。
4、节点间网络访问正常。

二、处理过程

1、node2上准备使用crsctl start res ora.crsd -init命令启用HAS 时有如下报错

[root@cloud4 bin]# ./crsctl start res ora.crsd -init
CRS-2672: Attempting to start 'ora.crf' on 'cloud4'
CRS-2672: Attempting to start 'ora.cssd' on 'cloud4'
CRS-2672: Attempting to start 'ora.diskmon' on 'cloud4'
CRS-2676: Start of 'ora.diskmon' on 'cloud4' succeeded
CRS-2676: Start of 'ora.crf' on 'cloud4' succeeded
CRS-2676: Start of 'ora.cssd' on 'cloud4' succeeded
CRS-2672: Attempting to start 'ora.ctssd' on 'cloud4'
CRS-2672: Attempting to start 'ora.cluster_interconnect.haip' on 'cloud4'
CRS-2676: Start of 'ora.ctssd' on 'cloud4' succeeded
CRS-2676: Start of 'ora.cluster_interconnect.haip' on 'cloud4' succeeded
CRS-2679: Attempting to clean 'ora.asm' on 'cloud4'
ORA-09925: Unable to create audit trail file
Linux-x86_64 Error: 13: Permission denied
Additional information: 9925
ORA-09925: Unable to create audit trail file
Linux-x86_64 Error: 13: Permission denied
Additional information: 9925
CRS-2681: Clean of 'ora.asm' on 'cloud4' succeeded
CRS-2672: Attempting to start 'ora.asm' on 'cloud4'
ORA-09925: Unable to create audit trail file
Linux-x86_64 Error: 13: Permission denied
Additional information: 9925
ORA-09925: Unable to create audit trail file
Linux-x86_64 Error: 13: Permission denied
Additional information: 9925
CRS-5017: The resource action "ora.asm start" encountered the following error: 
ORA-09925: Unable to create audit trail file
Linux-x86_64 Error: 13: Permission denied
Additional information: 9925
ORA-09925: Unable to create audit trail file
Linux-x86_64 Error: 13: Permission denied
Additional information: 9925
. For details refer to "(:CLSN00107:)" in "/u01/app/grid/diag/crs/cloud4/crs/trace/ohasd_oraagent_grid.trc".
CRS-2674: Start of 'ora.asm' on 'cloud4' failed
CRS-2679: Attempting to clean 'ora.asm' on 'cloud4'
ORA-09925: Unable to create audit trail file
Linux-x86_64 Error: 13: Permission denied
Additional information: 9925
ORA-09925: Unable to create audit trail file
Linux-x86_64 Error: 13: Permission denied
Additional information: 9925
CRS-2681: Clean of 'ora.asm' on 'cloud4' succeeded
CRS-2673: Attempting to stop 'ora.cluster_interconnect.haip' on 'cloud4'
CRS-2677: Stop of 'ora.cluster_interconnect.haip' on 'cloud4' succeeded
CRS-2673: Attempting to stop 'ora.ctssd' on 'cloud4'
CRS-2677: Stop of 'ora.ctssd' on 'cloud4' succeeded
CRS-2673: Attempting to stop 'ora.cssd' on 'cloud4'
CRS-2677: Stop of 'ora.cssd' on 'cloud4' succeeded
CRS-4000: Command Start failed, or completed with errors.
ORA-09925: Unable to create audit trail file

应该是文件权限问题,无法正常创建audit file。

2、在grid用户下检查$GRID_HOME/rdbms/aduit 目录权限发现,改目录的属主为root,属组也为root,且只有rx-r-----的权限

3、检查发现grid安装目录和oracle 安装目录很多目录的属主和属组错乱,对于grid 的权限错误可以使用root.sh来修复也可以在正常节点把

如在node1上拷贝对应文件权限

getfacl   /u01/app/12.1.0/grid  > grid.ora
在异常节点做如下操作,恢复用户权限

set –restore grid.ora

4、按照上述检查方法检查node4 各目录的权限,然后进行修复。

5、在node2和node4上使用crsctl start res ora.crsd -init启动服务。

三、问题原因

oracle GI和oracle DATABASE安装完毕后最好不要随意对目录的权限进行调整,调整后会导致cluster或db启动不了,也可能导致其他各种各样的问题。

本例中用户对cluster的安装目录进行了更改属主属组的操作导致cluster无法启动。

四、管理建议

oracle 安装完毕后主要涉及几个用户

root,HA高可用性管理用户

grid,ASM管理用户

oracle,DB管理A用户

加强对用户的权限控制无关人员禁止使用root登陆,对安装目录不要自建目录和修改目录权限。




提供的引用内容中未提及在Oracle 12c RAC节点上打补丁的方法。通常,在Oracle 12c RAC节点上打补丁可以按以下通用步骤进行: ### 准备工作 - **备份数据**:对数据库进行全量备份,包括数据文件、控制文件、归档日志等,以防止打补丁过程中出现问题导致数据丢失。 - **检查系统状态**:确保数据库和操作系统处于稳定状态,没有正在进行的重要任务。检查磁盘空间是否充足,内存使用情况等。 - **下载补丁**:从Oracle官方支持网站下载所需的补丁包,并将其上传到目标节点的合适目录。 ### 停库操作 - **关闭数据库实例**:使用`shutdown immediate`命令关闭要打补丁的节点上的数据库实例。 ```sql sqlplus / as sysdba shutdown immediate; exit; ``` - **停止集群资源**:停止该节点上的集群资源,例如使用`crsctl`命令。 ```bash crsctl stop resource -all -n <node_name> ``` ### 应用补丁 - **解压补丁包**:在目标节点上解压下载的补丁包。 ```bash unzip <patch_file>.zip -d <patch_directory> ``` - **运行预检查脚本**:进入补丁目录,运行预检查脚本,检查系统是否满足打补丁的条件。 ```bash cd <patch_directory> ./runprepatch.sh ``` - **应用补丁**:使用`opatch`工具应用补丁。 ```bash opatch apply ``` ### 启动操作 - **启动集群资源**:使用`crsctl`命令启动该节点上的集群资源。 ```bash crsctl start resource -all -n <node_name> ``` - **启动数据库实例**:使用`startup`命令启动数据库实例。 ```sql sqlplus / as sysdba startup; exit; ``` ### 验证补丁 - **检查数据库状态**:确保数据库正常运行,没有报错信息。 - **检查补丁应用情况**:使用`opatch lsinventory`命令检查补丁是否成功应用。 ```bash opatch lsinventory ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值