[HZ]RAC实例和线程

一,Oracle集群体系结构
1, Oracle RAC,全称是Oracle Real Application Cluster,即真正的应用集群,是Oracle提供一个并行集群系统,整个集群系统由Oracle Cluster(集群就绪软件)和Real Application Clusters(RAC)两大部分组成。
2, Oracle RAC的实质是位于不同操作系统的Oracle实例节点同时访问同一个Oracle数据库,每个节点通过私有网络进行通信,相互监控节点的运行状态;Oracle数据库所有的数据文件、联机日志文件、控制文件等均放在集群
共享存储设备上,而共享存储设备可以是RAW(楼设备,没有文件系统)、ASM、OCFS2(oracle提供的共享文件系统)等,所有集群节点可以同时读写共享存储。
3,Oracle RAC的基本拓扑图如下所示:



4, 由拓扑结构可知:
一个Oracle Rac数据库有多个服务器节点组成,每个服务器节点上都有自己独立的OS、ClusterWare、Oracle Rac 数据库程序等,并且每个节点都有自己的网络监听器。ClusterWare是一个集群软件,主要用于集群系统管理,Oracle Rac数据库程序用于提供Oracle实例进程,以供客户端访问集群系统,监听服务主要用于监听自己的网络端 口信息,所有的服务和程序通过操作系统都去访问一个共享存储,最终完成数据的读写。共享存储的实现方式有很多种,可以通过自动存储管理(ASM)、Oracle集群文件系统(OCFS)、裸设备(Raw)、网络区域存储(NAS) 等来保证整个群集数据的一致性。
5, 从Oracle 10g起,Oracle提供了自己的集群软件,即Oracle Clusterware,通过CRS(Cluster Ready Services)来实现,这个软件是安装Oracle RAC的前提,也是RAC环境稳定运行的基础,在Oracle 10g之前的版本,安装 RAC时必须借助域第三方的集群软件,而在Oracle10g以后,安装Oracle rac时,可以用Oracle自带的集群软件,也可以使用经过RAC认证的第三方集群软件来代替。
6, 常用的集群拓扑

7, 从Oracle的运行机制来说,集群的每台服务器就是一个Oracle实例多个Oracle实例对应同一个Oracle数据库,组成了Oracle数据库集群,从图中可以看出,运行在两个节点上的数据库实例访问同一个RAC数据库,并且两个节 点的本地磁盘仅用来存放Oralce安装程序和ClusterWare软件,而在共享存储上,存放了Oracle的数据库文件、控制文件、联机日志文件、归档日志文件等,这是安装Oracle Rac时的一种数据存放分配方式,其实RAC提供了多 种数据存储方式。
二,Oracle ClusterWare 简介
1, Cluster Ready Services 简称CRS,是Oracle开发的一个集群软件,与其他集群软件类似,CRS主要完成集群成员管理、心跳监控、故障切换等功能,CRS要求每个集群节点的操作系统必须相同,这样,通过CRS将多个节点 的操作系统绑定到了一起,客户端对集群的访问,就像访问一台服务器一样。
2, CRS主要有两个集群套件组成,分别是Voting disk 和 Oracle Cluster Registry。voting disk,即为表决磁盘,集群中的每个节点定期评估自身的健康情况,然后把它的状态信息放入到表决磁盘上。并且节点间也会相互 查看其运行状态,并把信息传递给其他节点进而写入表决磁盘。当群集节点发生故障时,还可以通过表决磁盘进行投票仲裁等,因此,表决磁盘必须放在共享存储设备上。以保证每个节点都能访问到。表决磁盘可以是一个裸 设备分区,也可以是一个独立的文件。由于它仅记录节点运行信息,磁盘大小一般在10-20M左右即可。
3, Oracle Cluster Registry,简称OCR,即集群注册服务,OCR主要用于记录RAC中集群和数据库的配置信息。这些信息包括了集群节点的列表、集群数据库实例到节点的映射以及CRS应用程序资源信息。CRS使用两种心跳设备
来验证节点成员的状态,保证集群的完整性:一个表决磁盘,集群同步服务进程每隔几秒种都会向表决磁盘写入一条心跳信息,集群通过表决磁盘即可验证节点的状态,如果某个磁盘在指定的最大时间内没有向表决磁盘写入 信息,集群就认为此节点失效了,进而执行故障切换。另一个心跳节点间私有以太网的心跳,通过这个心跳机制可以判断节点间是否出现了网络故障,两种心跳机制的结合,有效地增加了集群的可靠性。 另外,CRS建议用于内部通讯的私有以太网必须和用于RAC节点间通讯的网络分开,也就是不能再同一个网络中,如果RAC节点间通讯的网络和私有以太网心跳在同一个网络内,那么,必须保证该网络不能被非集群系统的节点访 问到。
三,CRS的后台进程
Oracle ClusterWare通过Cluster Ready Services来完成集群功能,CRS包含了一组相互协作的后台进程,下面详细介绍CRS中的几个重要的后台进程。
1, Cluster Synchronization Services,简称CSS,用于管理与协调急群中的各节点的关系,并用于节点间通信,当节点在加入或离开集群时,都由CSS进行通知集群。CSS在急群众对应的后台进程为CSSD,该进程有Oracle用
户运行和管理。当节点放生故障时,cssd会自动重启操作系统。
2, Cluster Ready Services,简称CRS,是管理集群内高可用操作的主要程序,在集群中CRS管理所有资源,包括数据库、服务、实例、vip地址、监听器、应用进程等,CRS在集群中对应的后台进程为CRSD,该进程可以对集群 资源进行启动、停止、监视和容错等操作,在正常状态下,CRSD监控节点各种资源,当某个资源发生异常时,自动重启或者切换该资源。
3, Process Monitor Daemon,简称OPROCD,此进程被锁定在内存中,用户监控集群及提供I/O防护(I/O fencing)。OPROCD运行在每一个节点上,且定期的执行健康检查,如果在超过它所希望的间隔内,仍然不能和某节点进 程通信,那么OPROCD将会重置处理器及重启节点。在一个OPROCD故障也将导致ClusterWare重启节点。
4, Oracle Noification Service,简称ONS,即Oracle通知服务,主要用于发布和订阅Fast Application Notification事件。
5, Event Management,简称EVM,是一个事件检测的后台进程,由Oracle用户运行和管理。
四,RAC数据库体系结构进程
1, RAC数据库简介
RAC数据库是一个具有共享缓存体系结构的集群数据库,他克服了传统不共享和共享磁盘方法的限制,为所有的业务应用程序提供了一种具有可伸缩性和可用性的数据库解决方案,它一般与Oracle 、clusterWare或第三方集群 软件共同组成Oracle集群系统。
2, RAC数据库是一个全共享的体系架构,它的所有数据文件、控制文件、练级日志文件、参数文件等都必须存放在共享磁盘中,因为只有这样,所有的节点才能访问到,RAC支持多种存储方式,可以使用下面几种方式的任意一 种:
五,RAC数据库的存储方式
1, 裸设备(Raw devices)
也就是不经过文件系统,将数据直接保存写入磁盘中,这种方式的好处是磁盘I/O性能很高,适合写操作频繁的业务系统,但缺点也很明显:数据维护和备份不方便,备份只能通过dd命令或者基于块级别的备份设备来完成,这 无疑增加了维护成本。
2, 集群文件系统
为了支持共享存储,Oralce开发了集群文件系统OCFS,这个文件系统可用于Windows、Linux和Solaris,现在已经发展到了OCFS2,通过OCFS2文件系统,多个集群节点可以同时读写一个磁盘而不破坏数据,但对于大量读写业务 系统,性能不是很高。另外,Oracle RAC也支持第三方集群文件系统,例如:redhat的GFS等。
3, 网络文件系统(NFS)
4, Automated Storage Management
Automate Storage Management,简称ASM,是Oracle推荐的共享数据存储方式,它是Oracle数据库10g包含的一个特性。ASM其实就是RAW方式存储数据,但是加入了数据管理功能,它通过将数据直接写入磁盘,避免了经过文件 系统而产生I/O消耗。因而,使用ASM很方便的管理共享数据,并提供异步I/O的性能。ASM还可以通过分配I/O负载来优化性能,免除了手动调整I/O的需要。
六,Oracle RAC的特点
通过RAC数据库,可以构建一个高性能、高可靠的数据库集群系统,RAC的优势在于:
1, 可以实现多节点的负载均衡
RAC数据库集群可以根据设定的调度策略,在集群节点间实现负载均衡,因此,RAC数据库每个节点都是工作的,同时也处于相互监控的状态,当某个节点出现故障时,RAC集群自动将失败的节点从集群隔离,并将失败节点的请 求自动转移到其他健康的节点上,从而实现服务透明切换。
2, 可以提供高可用服务
这个是Oracle ClusterWare实现的功能,通过CRS可以实现节点状态监控,故障透明转移,这保证了Oracle数据库可以不间断的提供服务。
3, 通过横向扩展提高了并发连接数,RAC这个优点非常适合大型的联机事务系统中。
4, 通过并行技术提高了事务相应的时间,这个是RAC集群的一大优势,通常用于数据分享系统中。
5, 很好的扩展性,在集群系统不能满足繁忙的业务系统时,RAC数据库很方便的添加集群节点,且可以在线完成节点的添加,并自动加入集群系统,不存在宕机时间;同时在不需要某个集群节点时,删除节点也非常简单。
七,RAC数据库也有一定的缺点
1, 与单击数据库相比,管理维护更复杂,并对维护人员要求更高
2, 底层规划设计不好时,系统整体性能会较差,甚至不如单击系统的性能。所以,如果对RAC数据库不是很了解,不建议马上在生产环境中使用。
3, 由于RAC集群系统需要的多个节点,那么需要购买多台服务器,同时需要Oracle企业级版本数据库,这无形中增加了软硬件成本。
八,RAC数据库数据一致性
1, RAC数据库时由多个节点构成的,每个节点就是一个数据库实例,而每个实例都有自己的后台进程和内存结构,而且在RAC集群中,每个实例的后台进程和内存结构都是相同的,从整体上来看,就像是一个单一数据库的镜像 ,但是,RAC数据库在结构上和单实例数据库也有不同之处:
2, RAC数据库的每个实例至少拥有一个额外的重做线程(redo thread)
3, RAC数据库的每个实例都拥有自己的撤销表空间(undo tablespace)很显然,这种机制是每个实例独立的使用自己的重做线程和撤销表空间,各自锁定自己修改的数据。
4, RAC这种设计方式,把很多的实例的操作相对独立的分开。那么RAC数据库如何实现节点数据的一致性哪,其实每个RAC实例的SGA内都有一个buffer cache(缓冲区),通过Cache Fusion(缓存融合)技术,RAC在各个节点 之前同步SGA中的缓存信息,从而保证了节点数据的一致性,同时也提高了集群的访问速度。
5, RAC数据库最大的特点是共享,那么如何实现多个节点有条不紊的数据共享哪,这就是要说的RAC的两个进程:即Global Cache Service(GCS)和the Global Enqueue Service(GES)
6, 全局缓存服务(GCS)和全局队列服务(GES)是最基本的RAC进程,主要用于协调对共享数据库和数据库内的共享资源的同时访问。同时,GES和GCS通过使用全局资源目录(Global Resource Directory ,GRD)来记录和维 护每个数据文件的状态信息,而GRD保存在内存中,内容分布存储在所有实例上,每个实例都管理部分内容。
九,RAC进程管理
RAC中通过几个特别的进程与GRD相结合,使得RAC可以使用缓存融合技术,这几个特别进程是:
1, Global Cache Service Processes(LMSn)
LMS进程主要管理集群内部数据块的访问,并在不同的实例的BUFFER CACHE中传输块镜像。
2, Global Enqeueue Service Monitor(LMON)
LMON主要监视集群内的全部资源和集群间的资源交互,并管理实例和处理异常,以及集群队列的恢复操作。
3, Global Enqueue Service Daemon(LMD)
LMD进程主要管理对全局队列和全局资源的访问,并更新相应队列的状态,处理来自其他实例的资源请求。
4, Lock Porcesses(LCK)
LCK进程主要管理实例间资源请求和跨实例调用操作,并管理除CacheFusion以外的资源请求,比如library 和row cache的请求等。
5, Diagnosability Deamon(DIAG)
DIAG进程主要用来捕捉实例中进程失败的诊断信息,并生成相应的TRACE文件。
十,安装RAC数据库的规划
1, 安装RAC数据库时涉及到软件有Oracle clusterWare 、Oracle Rac 数据库软件,同时还涉及到voting disk、OCR等,关于每部分需要占用磁盘空间大小如下:

2, 在了解了RAC每部分所需的磁盘空间大小后,就可以根据每部分的用途规划数据存储了。RAC广泛支持各种数据存储方式,例如单一日志文件系统ext2/ext3、集群文件系统OCFS2/GFS、网络文件系统NFS、裸设备RAW、自动存 储管理ASM等,下表列出了可以使用的存储类型:

3, 具体使用哪一种存储策略,根据安装RAC环境的不同而不同,推荐三种常用的存储方式;



来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29611940/viewspace-1148813/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/29611940/viewspace-1148813/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值