11g R2新特征:oracle cluster health moniter (CHM) 简介

本文深入探讨了Oracle集群管理系统CHM的原理、组件及其在集群管理中的应用,包括systemmonitorserver(osysmond)和clusterlogger服务的工作机制,以及如何通过CHMRepository收集和存储系统资源使用情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用top进行服务器检查时,发现一个进程消耗CPU比较多,于是查找资料学习了下。
13934 root      RT   0  760m  94m  55m S  8.8  0.1  12973:32 osysmond.bin
cluster health monitor (CHM) 是一个oracle提供的工具,用来自动收集操作系统的资源(cpu、内存、swap、进程、I/O以及网络等)的使用情况。CHM会每秒收集一次数据。

这些系统资源数据对于诊断集群系统的节点重启、hang、实例驱逐、性能问题等非常有帮助。另外,用户可以使用CHM及早发现一些系统负载高、内存异常等问题,从而避免产生更严重的问题。

在集群中,可以通过下面的命令查看CHM对应的资源(ora.crf)的状态:
[grid@RAC-1 ~]$ crsctl stat res -t -init
--------------------------------------------------------------------------------
NAME           TARGET  STATE        SERVER                   STATE_DETAILS       
--------------------------------------------------------------------------------
Cluster Resources
--------------------------------------------------------------------------------
ora.asm
      1        ONLINE  ONLINE       rac-1                    Started             
ora.cluster_interconnect.haip
      1        ONLINE  ONLINE       rac-1                                        
ora.crf
      1        ONLINE  ONLINE       rac-1                                        
ora.crsd
      1        ONLINE  ONLINE       rac-1                                        
ora.cssd
      1        ONLINE  ONLINE       rac-1                                        
ora.cssdmonitor
      1        ONLINE  ONLINE       rac-1                                        
ora.ctssd
      1        ONLINE  ONLINE       rac-1                    OBSERVER            
CHM主要包括两个服务:
1)system monitor server (osysmond):这个服务在所有节点都会运行,osysmond会将每个节点的资源使用情况发送给cluster  logger  server,后者将会把所有节点的信息都接受并保存到CHM的资料库。
$ps -ef|grep osysmond

2) cluster logger  service  (ologgerd):
在一个集群中的ologgerd会有一个主节点(master),还有一个备节点(standby)。当ologger在当前节点遇到问题无法启动后,它会在备用节点启用。
主节点:
$ps -ef|grep  ologgerd
备节点:
$ps  -ef|grep  ologgerd

CHM Repository: 用于存放收集到的数据,默认情况下,会存在于grid_home下,需要1GB的磁盘空间,每个节点大约每天会占用0.5G空间。可以使用oclumon来调整它的存放路径以及允许的空间大小。(最多只能保存3天的数据)
查看当前的设置:
$oclumon manager -get reppath

$oclumon  manager -get repsize
获取CHM生成的数据方法为oclumon

 ./oclumon dumpnodeview -allnodes -v -s "2014-05-28 14:00:00" -e "2014-05-28 14:15:00" >/tmp/chm1.txt 
-s 表示开始时间    -e表示结束时间
[root@RAC-1 tmp]# more chm1.txt |more


----------------------------------------
Node: rac-1 Clock: '05-28-14 14.00.04' SerialNo:1309648
----------------------------------------


SYSTEM:
#cpus: 64 cpu: 0.69 cpuq: 3 physmemfree: 32022376 physmemtotal: 132281976 mcache: 94214228 swap
free: 138412016 swaptotal: 138412016 ior: 608 iow: 763 ios: 199 swpin: 0 swpout: 0 pgin: 238 pg
out: 379 netr: 52.986 netw: 40.369 procs: 1896 rtprocs: 205 #fds: 10698 #sysfdlimit: 6815744 #d
isks: 213 #nics: 3  nicErrors: 0


TOP CONSUMERS:
topcpu: 'osysmond.bin(13934) 12.1' topprivmem: 'java(54844) 309616' topshm: 'oracle(66720) 2525
0140' topfd: 'ohasd.bin(13768) 715' topthread: 'java(54844) 84'


PROCESSES:


name: 'osysmond.bin' pid: 13934 #procfdlimit: 65536 cpuusage: 12.1 privmem: 39420 shm: 57216 #f
d: 59 #threads: 10 priority: -100 nice: 0
name: 'oracle' pid: 66673 #procfdlimit: 65536 cpuusage: 1.40 privmem: 1904 shm: 15308 #fd: 34 #
threads: 1 priority: -2 nice: 0
name: 'oracle' pid: 56009 #procfdlimit: 65536 cpuusage: 1.40 privmem: 2180 shm: 12924 #fd: 34 #
threads: 1 priority: -2 nice: 0
name: 'ocssd.bin' pid: 55720 #procfdlimit: 65536 cpuusage: 1.0 privmem: 82568 shm: 55048 #fd: 1
86 #threads: 30 priority: -100 nice: 0
name: 'oracle' pid: 66688 #procfdlimit: 65536 cpuusage: 0.80 privmem: 20524 shm: 48328 #fd: 44 
#threads: 1 priority: 20 nice: 0
name: 'oraagent.bin' pid: 66565 #procfdlimit: 65536 cpuusage: 0.80 privmem: 31780 shm: 16576 #f
d: 44 #threads: 14 priority: 20 nice: 0
name: 'orarootagent.bi' pid: 56196 #procfdlimit: 65536 cpuusage: 0.80 privmem: 24276 shm: 13696
 #fd: 18 #threads: 9 priority: 20 nice: 0
name: 'crsd.bin' pid: 56070 #procfdlimit: 65536 cpuusage: 0.80 privmem: 33540 shm: 23512 #fd: 1
26 #threads: 44 priority: 20 nice: 0
name: 'orarootagent.bi' pid: 13917 #procfdlimit: 65536 cpuusage: 0.80 privmem: 38304 shm: 15944
--More--
 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22969361/viewspace-1171817/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/22969361/viewspace-1171817/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值