CRS-1006 , CRS-0215 故障一例

在SLES10SP3环境下配置Oracle10gRAC监听器时遇到节点VIP漂移问题,通过检查路由配置并为缺失的默认网关追加,最终解决了监听器无法启动的问题。

安装好sles 10 sp3 + Oracle 10g RAC之后,在配置监听器时,总是提示主机bo2dbp上的监听服务已经在运行,忽略错误之后手动在bo2dbp节点上启,总是收到TNS-12545: Connect failed because target host or object does not exist错误信息。后来发现节点bo2dbp的vip总是漂移到另一节点bo2dbs上,原来这才是罪魁祸首 ??????

1、集群环境netca之后,节点bo2dbp监听无法启动
手动尝试启动监听仍不成功,查看了listener.ora以及监听日志未发现任何异常,查看主机/etc/hosts配置也正常
无奈之下,删除监听器
oracle@bo2dbp:~> crs_stat -t
Name Type Target State Host
------------------------------------------------------------
ora....BP.lsnr application ONLINE OFFLINE
ora.bo2dbp.gsd application ONLINE ONLINE bo2dbp
ora.bo2dbp.ons application ONLINE ONLINE bo2dbp
ora.bo2dbp.vip application ONLINE ONLINE bo2dbs
ora....BS.lsnr application ONLINE ONLINE bo2dbs
ora.bo2dbs.gsd application ONLINE ONLINE bo2dbs
ora.bo2dbs.ons application ONLINE ONLINE bo2dbs
ora.bo2dbs.vip application ONLINE ONLINE bo2dbs

2、节点bo2dbp.vip被漂移到bo2dbs
oracle@bo2dbp:~/product/10.2.0/crs_1/bin> crs_stat -t
Name Type Target State Host
------------------------------------------------------------
ora.bo2dbp.gsd application ONLINE ONLINE bo2dbp
ora.bo2dbp.ons application ONLINE ONLINE bo2dbp
ora.bo2dbp.vip application ONLINE ONLINE bo2dbs
ora.bo2dbs.gsd application ONLINE ONLINE bo2dbs
ora.bo2dbs.ons application ONLINE ONLINE bo2dbs
ora.bo2dbs.vip application ONLINE ONLINE bo2dbs

3、尝试为bo2dbp进行relocate也不听使唤
oracle@bo2dbp:~/product/10.2.0/crs_1/bin> ./crs_relocate ora.bo2dbp.vip -c bo2dbp
Attempting to stop `ora.bo2dbp.vip` on member `bo2dbs`
Stop of `ora.bo2dbp.vip` on member `bo2dbs` succeeded.
Attempting to start `ora.bo2dbp.vip` on member `bo2dbp`
Start of `ora.bo2dbp.vip` on member `bo2dbp` failed.
Attempting to start `ora.bo2dbp.vip` on member `bo2dbs`
Start of `ora.bo2dbp.vip` on member `bo2dbs` succeeded.
CRS-0217: Could not relocate resource 'ora.bo2dbp.vip'.

4、crs_stop 出马
oracle@bo2dbp:~/product/10.2.0/crs_1/bin> crs_stop ora.bo2dbp.vip
Attempting to stop `ora.bo2dbp.vip` on member `bo2dbs`
Stop of `ora.bo2dbp.vip` on member `bo2dbs` succeeded.

oracle@bo2dbp:~/product/10.2.0/crs_1/bin> crs_start ora.bo2dbp.vip
Attempting to start `ora.bo2dbp.vip` on member `bo2dbp`
Start of `ora.bo2dbp.vip` on member `bo2dbp` failed.
Attempting to start `ora.bo2dbp.vip` on member `bo2dbs`
Start of `ora.bo2dbp.vip` on member `bo2dbs` succeeded.

我晕,又漂移到bo2dbs节点

5、狠一点,直接将节点2bo2dbs的crs停掉,这下没得漂了吧 :)
bo2dbs:/u01/app/oracle/product/10.2.0/crs_1/bin # ./crsctl stop crs
Stopping resources. This could take several minutes.
Successfully stopped CRS resources.
Stopping CSSD.
Shutting down CSS daemon.
Shutdown request successfully issued.

6、露出马脚
oracle@bo2dbp:~/product/10.2.0/crs_1/bin> crs_start ora.bo2dbp.vip
Attempting to start `ora.bo2dbp.vip` on member `bo2dbp`
Start of `ora.bo2dbp.vip` on member `bo2dbp` failed.
Remote start for `ora.bo2dbp.vip` failed on member `bo2dbs`
CRS-1006: No more members to consider

CRS-0215: Could not start resource 'ora.bo2dbp.vip'.



7、check log

oracle@bo2dbp:~/product/10.2.0/crs_1/log/bo2dbp/racg> tail -50 ora.bo2dbp.vip.log

2012-08-30 16:18:55.942: [ RACG][4250161648] [20571][4250161648][ora.bo2dbp.vip]: end for resource = ora.bo2dbp.vip, action = start, status = 1, time = 6.390s

2012-08-30 16:19:30.968: [ RACG][4041843184] [20878][4041843184][ora.bo2dbp.vip]: checkIf: Default gateway is not defined (host=bo2dbp)
Interface eth0 checked failed (host=bo2dbp)
Invalid parameters, or failed to bring up VIP (host=bo2dbp)

原来醉鬼祸首尽然是没有缺省网关,我倒倒倒......
记得之前的安装就碰到过在节点2上没有缺省网关导致vipca不能继续的情形。这次又碰上了。汗。。。
oracle@bo2dbp:~> cat /etc/sysconfig/network/routes
cat: /etc/sysconfig/network/routes: No such file or directory
oracle@bo2dbp:~> ssh bo2dbs cat /etc/sysconfig/network/routes
default 192.168.7.254 - -

使用root帐户为其追加网关后,一切ok.

oracle@bo2dbs:~> crs_stat -t
Name Type Target State Host
------------------------------------------------------------
ora.bo2dbp.gsd application ONLINE ONLINE bo2dbp
ora.bo2dbp.ons application ONLINE ONLINE bo2dbp
ora.bo2dbp.vip application ONLINE ONLINE bo2dbp
ora.bo2dbs.gsd application ONLINE ONLINE bo2dbs
ora.bo2dbs.ons application ONLINE ONLINE bo2dbs
ora.bo2dbs.vip application ONLINE ONLINE bo2dbs

8、问题环境
sles 10/sp3 + Oracle 10g(10.2.0.4)

9、小结:
a、细心细心再细心
b、根据相应的日志快速定位故障

由于给定引用未涉及col/crs的相关内容,以下是关于col/crs的一般性介绍: ### 含义 - **COL(Columnar Storage,列存储)**:是一种数据库数据存储方式,与传统的行存储不同,它按列而不是按行来存储数据。例如在一个包含姓名、年龄、地址等字段的表中,行存储会将每一行的所有字段数据连续存储在一起,而列存储会将所有姓名数据存储在一起,所有年龄数据存储在一起,以此类推。 - **CRS(Cluster Ready Services,集群就绪服务)**:通常指Oracle集群就绪服务,它是Oracle Real Application Clusters (RAC) 环境中的基础组件,负责管理和维护集群中各个节点之间的通信、资源协调和故障转移等功能。 ### 用途 - **COL(列存储)**:适用于数据分析和数据仓库场景。由于查询通常只涉及表中的少数列,列存储可以减少I/O读取量,提高查询性能。例如在数据仓库中进行复杂的聚合查询时,列存储可以快速定位和读取所需列的数据,而不需要像行存储那样读取整行数据。 - **CRS(集群就绪服务)**:用于构建高可用性和可扩展性的数据库集群。在企业级应用中,保证数据库的持续可用性至关重要。CRS可以监控集群中各个节点和服务的状态,当某个节点出现故障时,能够自动将服务转移到其他正常节点上,确保业务的连续性。 ### 相关技术信息 - **COL(列存储)**: - **压缩技术**:列存储通常会使用高效的压缩算法,因为同一列的数据具有较高的相似性,压缩比通常比行存储高,进一步减少存储空间和I/O开销。 - **向量化执行**:现代数据库系统为列存储设计了向量化执行引擎,它可以一次处理一批列数据,提高CPU利用率和查询执行速度。 ```sql -- 以Snowflake数据库为例,创建列存储表 CREATE TABLE sales ( product_id INT, sale_date DATE, amount DECIMAL(10, 2) ) STORAGE = COLUMNAR; ``` - **CRS(集群就绪服务)**: - **心跳机制**:CRS通过心跳信息来监控集群中各个节点的状态,节点之间定期交换心跳消息,以检测节点是否正常运行。 - **资源管理**:负责管理集群中的各种资源,如磁盘、网络、数据库实例等,确保资源的合理分配和使用。 - **故障转移**:当某个节点出现故障时,CRS会自动触发故障转移机制,将受影响的服务迁移到其他可用节点上,并恢复服务的正常运行。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值