ORACLE CHM问题处理

ClusterHealthMonitor (CHM) 是Oracle提供的一款工具,用于自动收集集群系统资源(如 CPU、内存、I/O 等)使用情况,帮助诊断节点重启、实例驱逐等问题。CHM 由 SystemMonitor 和 ClusterLoggerService 组成,前者负责收集信息,后者负责保存信息。用户可通过调整 CHMRepository 的位置与大小来优化存储。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Cluster Health Monitor(以下简称 CHM)是一个 ORACLE 提供的工具,用来自动收集操作系统的资源(CPU、内存、SWAP、进程、I/O以及网络等)使用情况。CHM会每秒收集一次数据。

 

这些系统资源数据对于诊断集群系统的节点重启、Hang、实例驱逐(Eviction)、性能问题等是非常有帮助的。另外,用户可以使用CHM来及早发现一些系统负载高、内存异常等问题,从而避免产生更严重的问题。

 

 

在集群中,可以通过下面的命令查看CHM对应的资源(ora.crf)的状态:

grid 用户下

$crsctl stat res –t –init

CHM主要包括两个服务:

1).System Monitor

  Service(osysmond):这个服务在所有节点都会运行,osysmond会将每个节点的资源使用情况发送给cluster logger service,后者将会把所有节点的信息都接收并保存到CHM的资料库.

2).Cluster Logger Service(ologgerd):在一个集群中的,ologgerd会有一个主机点(master),还有一个备节点(standby).ologgerd在当前的节点遇到问题无法启动后,它会在备用节点启用。

 

CHM Repository:用于存放收集到数据,默认情况下,会存在于Grid Infrastructure home,需要1GB的磁盘空间,每个节点大约每天会占用0.5GB的空间,您可以使用OCLUMON来调整它的存放路径以及的空间大小。

下面的命令用来查看它当前的设置:

$oclumon manage –get reppath

CHM Repository Path = /oracle/app/gridhome/crf/db/bpmjl2

 

 Done

$oclumon manage –get resize

 

CHM Repository Size = 1094795585   <=========单位为秒

 

Done

修改路径:

$oclumon manage –repos reploc /shared/oracle/chm

修改大小:

$oclumon manage –repos resize 68083

 

 

查看ora 服务

crsctl stat res -t -init

可以关闭CHM服务.

查看ora.crf服务

$crsctl stat res ora.crf –init

停止ora.crf服务

$crsctl stop res ora.crf –init

然后删除crfclust.bdb文件 (两个节点都需要删除)

 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/26975903/viewspace-2147193/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/26975903/viewspace-2147193/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值