OracleRAC同时具备HA(HighAvailiablity)和LB(LoadBalance).而其高可用性的基础就是Failover(故障转移).它指集群中任何一个节点的故障都不会影响用户的使用,连接到故障节点的用户会被自动转移到健康节点,从用户感受而言,是感觉不到这种切换。
Oracle10gRAC的Failover可以分为3种:
1.Client-SideConnecttimeFailover
2.TAF
3.Service-SideTAF
注意事项:不能在listener.ora文件中设置GLOBAL_NAME,因为这个参数会禁用Connect-timeFailover和TransparentApplicationFailover.
一.Client-SideConnectTimeFailover
Client-SideConnectTimeFailover的含义:如果用户端tnsname中配置了多个地址,用户发起连接请求时,会先尝试连接地址表中的第一个地址,如果这个连接尝试失败,则继续尝试使用第二个地址,直至连接成功或者遍历了所有的地址。
这种Failover的特点: 只在建立连接那一时刻起作用,也就是说,这种Failover方式只在发起连接时才会去感知节点故障,如果节点没有反应,则自动尝试地址列表中的下一个地址。一旦连接建立之后,节点出现故障都不会做处理,从客户端的表现就是会话断开了,用户程序必须重新建立连接。
启用这种Failover的方法就是在客户端的tnsnames.ora中添加FAILOVER=ON条目,这个参数默认就是ON,所以即使不添加这个条目,客户端也会获得这种Failover能力。
示例:
RAC=
(DESCRIPTION=
(ADDRESS=(PROTOCOL=TCP)(HOST=rac1-vip)(PORT=1521))
(ADDRESS=(PROTOCOL=TCP)(HOST=rac2-vip)(PORT=1521))
(LOAD_BALANCE=YES)
(
CONNECT_DATA=
(SERVER=DEDICATED)
(SERVICE_NAME=RAC)
)
)
注:rac1-vip,rac2-vip要添加到hosts文件中,不然可能解析不了。
二.TAF(TransparentApplicationFailover)
这块的配置,参考:
10g & 11g Configuration of TAF(Transparent Application Failover) and Load Balancing [ID 453293.1]
现在的大部分流行的应用系统(如:weblogic,Jboss),都是启动时就建立若干到数据库的长连接,在应用程序整个生命周期内重用这些连接。而Client-SideConnetTimeFailover的工作方式是它对应用程序的可用性没有太大帮助。
所以从Oracle8.1.5版本只有引入了新的Failover机制—TAF。所谓TAF,就是连接建立以后,应用系统运行过程中,如果某个实例发生故障,连接到这个实例上的用户会被自动迁移到其他的健康实例上。对于应用程序而言,这个迁移过程是透明的,不需要用户的介入,当然,这种透明要是有引导的,因为用户的未提交事务会回滚。相对与Client-SideConnectTimeFailover的用户程序中断,抛出连接错误,用户必须重启应用程序,TAF这种方式在提高HA上有了很大的进步。
TAF的配置也很简单,只需要在客户端的tnsnames.ora中添加FAILOVER_MODE配置项。这个条目有4个子项目需要定义。
1.METHOD:用户定义何时创建到其实例的连接,有BASIC和PRECONNECT两种可选值。
BASIC:是指在感知到节点故障时才创建到其他实例的连接。
PRECONNECT:是在最初建立连接时就同时建立到所有实例的连接,当发生故障时,立刻就可以切换到其他链路上。
两种方法比较:BASIC方式在Failover时会有时间延迟,PRECONNECT方式虽然没有时间延迟,但是建立多个冗余连接会消耗更多资源,两者就是是用时间换资源和用资源换时间的区别。
2.TYPE:用于定义发生故障时对完成的SQL语句如何处理,其中有2种类型:session和select.
这2种方式对于未提交的事务都会自动回滚,区别在于对select语句的处理,对于select,用户正在执行的select语句会被转移到新的实例上,在新的节点上继续返回后续结果集,而已经返回的记录集则抛弃。
假设用户正在节点1上执行查询,整个结果集共有100条记录,现在已从节点1上返回10条记录,这时节点1宕机,用户连接被转移到节点2上,如果是session模式,则需要重新执行查询语句;如果是select方式,会从节点2上继续返回剩下的90天记录,而已经从节点1返回的10条记录不会重复返回给用户,对于用户而言,感受不到这种切换。
显然为了实现select方式,Oracle必须为每个session保存更多的内容,包括游标,用户上下文等,需要更多的资源也是用资源换时间的方案。
3.DELAY和RETRIES:这2个参数分别代表重试间隔时间和重试次数。
示例:
RAC=
(DESCRIPTION=
(ADDRESS=(PROTOCOL=TCP)(HOST=rac1-vip)(PORT=1521))
(ADDRESS=(PROTOCOL=TCP)(HOST=rac2-vip)(PORT=1521))
(LOAD_BALANCE=YES)
(
CONNECT_DATA=
(SERVER=DEDICATED)
(SERVICE_NAME=RAC)
(
FAILOVER_MODE=
(TYPE=session)
(METHOD=basic)
(RETRIES=180)
(DELAY=5)
)
)
)
三.Service-SideTAF
Service-Side TAF的配置参考:
How To Configure Server Side Transparent Application Failover [ID 460982.1]
Service-SideTAF可以看作是TAF的一种变种,首先Service-SideTAF也是TAF,所有TAF的特点它都有,其次这种TAF是在服务器上配置的,而不像TAF是在客户端配置的。
Client-SideTAF是在客户端修改tnsnames.ora文件来配置的,如果有很多客户端使用这个数据库,那么每次微笑调整都需要把所有的计算机更改一遍,既低效又容易出错。而Service-SideTAF通过结合Service,在数据库里保存FAIL_MODE的配置,把所有的TAF配置保存在数据字典中,从而省去了客户端的配置工作,现在客户端的TNS文件就不需要任何TAF的配置选项了。
从配置参数而言,Service-SideTAF和TAF相比多了一个InstanceRole(实例角色)的概念。所谓的实例角色,就是当有多个Instance参与一个Service时,可以配置优先使用哪一个Instance为用户提供服务。用户共有两种可选角色。
PREFERRED:首选实例,会优先选择拥有这个角色的实例提供服务。
AVAILABLE:后备实例,用户连接会优先连接PREFFERRED的Instance,当PREFERRED的Instance不可用时,才会被转到AVAILBALE的Instance上。
要使用Server-SideTAF必须配置Service。Service可以在创建数据库时创建,也可以在创建数据库之后修改,既可以使用dbca配置向导,也可以用命令行的方式配置。
3.1用DBCA配置Service
1).运行DBCA,选择ORACLERACApplicationClustersdatabase
2).在第二个界面选择:ServicesManagement
3).第三个界面会出现RAC数据库列表,用户可以在这个列表中选择要配置Service的数据库
4).在Serice配置界面中,单击Add创建新的Service,输入service名字。在Instance列表框定义实例角色,选择那个service1作为Preferred(首选实例),Service2作为availiable(后备实例)。TAFPolicy有三个选项:None,Basic,Pre-connect。我们选Basic。最后点击Finish,完成Service配置。
5)在结束Service配置后,服务会自动启动。
3.2用srvctl命令配置Service
用命令行方式配置Service对远程维护很有用。先来看一下相关命令
1)创建service
#Srvctladdservice-d<database-name>-s<service-name>-r"preferred-instance-list"-a"available-instance-list"-P<TAF-policy>
其中TAF-Policy可选:basic和preconnect。例如:
srvctladdservice-dRAC-sService2-r"RAC1,RAC2"-a"RAC3,RAC4"-Pbasic
注意:srvctladdservice中,只有perferred才会创建服务。即在OCR中注册一个ora.raw.dmm.Raw1.Srv的服务。
2)查看配置信息
#srvctlconfigservice-ddatabase-name[-sservice-name][-a]
如果这里不指定"-sservice-name",就会显示所有Service的配置,这些配置包括preferred和availableinstance.使用-a选项,还会显示TAF相关信息。
3)是否自动运行service
数据库启动时,会自动启动所有的Service。有时为了为了维护需要,需要禁用这个特性,在维护完成后再启动这个特性。
#srvctlenable/disableservice-ddatabase-name-sservice-name-iinstance-name
4)启动service
#srvctlstartservice-d<database-name>-s<service-name>-iinstance-name-ostart-option-cconnect-string-q
如果不指定service-name,则所有的service都会被启动,可以使用逗号分隔方式,同时启动多个service。-i指定在那个实例上启动service。
5)停止service
#srvctlstopservice-d<database-name>-s<service-name>-iinstance-name-cconnect-string-q-f
其中-f选项可以强制关闭service,并中断了其所有用户的连接。
6)查看service状态
#srvctlstatusservice-d<database-name>-sservice-name-iinstance-name-f-v
其中-f可以显示被disable的instance信息,而-v可以显示详细输出
7)删除service
#srvctlremoveservice-ddatabase-name-sservice-name-iinstance-name[-f]
注意:在使用srvctl创建service时,需要注意TAF策略选项必须通过dbms_service包来配置。
示例:
Begin
Dbms_service.modify_service(
Service_name='>Service1',
Failover_method=>dbms_service.failover_method_basic,
Failover_type=>dbms_service.failover_type_select,
Failover_retries=>180,
Failover_delay=>5
);
End;
3.3配置Service的注意事项
1).数据库的服务名是用service_name参数来指定的,一个数据库可以有多个服务名,但是service_name最长是4kb,不要手工来修改这个参数
2)最多可以创建64个service,每个数据库有2个隐含的service,因此留给用户的就只有62个service。不能修改这两个隐含service的配置,并且也不能手工启动或停止这2个服务。这两个隐含的service分别是:SYS$BACKGROUND和SYS$USERS.
3)当使用dbca配置Service时,dbca会自动更新OCR,启动Service,当删除service时,会停止service,并更新OCR.
4)使用srvctl这个工具时,命令只更新OCR中的配置,不会更新datadctionary和listener中的信息,因此还需要使用dbma_servie包来更新datadictionary,手工更改listener配置文件。故推荐使用DBCA工具来配置更改service配置
5)如果客户端想通过Service方式连接数据库,需要在tns条目中使用service_name方式引用数据库。如:
RAC=
(DESCRIPTION=
(ADDRESS=(PROTOCOL=TCP)(HOST=rac1-vip)(PORT=1521))
(ADDRESS=(PROTOCOL=TCP)(HOST=rac2-vip)(PORT=1521))
(LOAD_BALANCE=YES)
(
CONNECT_DATA=
(SERVER=DEDICATED)
(SERVICE_NAME=RAC)
)
)
注意:无论是使用dbca工具还是使用srvctl命令来配置service,都无法配置TAF的TYPE,DELAY,RETRIES三个属性,必须使用dbms_service包来修改这些属性。
四.Srvctl命令测试实例
先查看一下RAC启动情况:
[root@raw1bin]#./crs_stat-t
NameTypeTargetStateHost
------------------------------------------------------------
ora.raw.dbapplicationONLINEONLINEraw1
ora.raw.raw.csapplicationONLINEONLINEraw1
ora....aw1.srvapplicationONLINEONLINEraw1
ora....aw2.srvapplicationONLINEONLINEraw2
ora....w1.instapplicationONLINEONLINEraw1
ora....w2.instapplicationONLINEONLINEraw2
ora....SM1.asmapplicationONLINEONLINEraw1
ora....W1.lsnrapplicationONLINEONLINEraw1
ora.raw1.gsdapplicationONLINEONLINEraw1
ora.raw1.onsapplicationONLINEONLINEraw1
ora.raw1.vipapplicationONLINEONLINEraw1
ora....SM2.asmapplicationONLINEONLINEraw2
ora....W2.lsnrapplicationONLINEONLINEraw2
ora.raw2.gsdapplicationONLINEONLINEraw2
ora.raw2.onsapplicationONLINEONLINEraw2
ora.raw2.vipapplicationONLINEONLINEraw2
[root@raw1bin]#ps-ef|grepsmon
root174833479007:30pts/100:00:00grepsmon
oracle265611007:06?00:00:01asm_smon_+ASM1
oracle270821007:06?00:00:05ora_smon_raw1
一切正常。
1)查看现有的service
[root@raw1bin]#su-oracle
[oracle@raw1~]$exportORACLE_SID=raw1
[oracle@raw1~]$sqlplus/nolog
SQL*Plus:Release10.2.0.1.0-ProductiononWedMar307:45:362010
Copyright(c)1982,2005,Oracle.Allrightsreserved.
SQL>conn/assysdba
Connected.
SQL>showparameterservice
NAMETYPEVALUE
-----------------------------------------------------------------
service_namesstringraw
SQL>
2)使用srvctl命令创建dmm服务
[oracle@raw2bin]$srvctladdservice-draw-sdmm-r"raw1,raw2"-Pbasic
[oracle@raw2bin]$crs_stat-t
NameTypeTargetStateHost
------------------------------------------------------------
ora.raw.dbapplicationONLINEONLINEraw1
ora.raw.dmm.csapplicationOFFLINEOFFLINE
ora....aw1.srvapplicationOFFLINEOFFLINE
ora....aw2.srvapplicationOFFLINEOFFLINE
ora....w1.instapplicationONLINEONLINEraw1
ora....w2.instapplicationONLINEONLINEraw2
ora....SM1.asmapplicationONLINEONLINEraw1
ora....W1.lsnrapplicationONLINEONLINEraw1
ora.raw1.gsdapplicationONLINEONLINEraw1
ora.raw1.onsapplicationONLINEONLINEraw1
ora.raw1.vipapplicationONLINEONLINEraw1
ora....SM2.asmapplicationONLINEONLINEraw2
ora....W2.lsnrapplicationONLINEONLINEraw2
ora.raw2.gsdapplicationONLINEONLINEraw2
ora.raw2.onsapplicationONLINEONLINEraw2
ora.raw2.vipapplicationONLINEONLINEraw2
[oracle@raw2bin]$srvctladdservice-draw-sdmm-rraw1-araw2-Pbasic
注意:srvctladdservice中,只有perferred才会创建服务。即在OCR中注册一个ora.raw.dmm.Raw1.Srv的服务。
3)确认服务创建成功,offline表示还没有启动
[oracle@raw2bin]$crs_stat-t
NameTypeTargetStateHost
------------------------------------------------------------
ora.raw.dbapplicationONLINEONLINEraw1
ora.raw.dmm.csapplicationOFFLINEOFFLINE
ora....aw1.srvapplicationOFFLINEOFFLINE
ora.raw.raw.csapplicationONLINEONLINEraw1
ora....aw1.srvapplicationONLINEONLINEraw1
ora....w1.instapplicationONLINEONLINEraw1
ora....w2.instapplicationONLINEONLINEraw2
ora....SM1.asmapplicationONLINEONLINEraw1
ora....W1.lsnrapplicationONLINEONLINEraw1
ora.raw1.gsdapplicationONLINEONLINEraw1
ora.raw1.onsapplicationONLINEONLINEraw1
ora.raw1.vipapplicationONLINEONLINEraw1
ora....SM2.asmapplicationONLINEONLINEraw2
ora....W2.lsnrapplicationONLINEONLINEraw2
ora.raw2.gsdapplicationONLINEONLINEraw2
ora.raw2.onsapplicationONLINEONLINEraw2
ora.raw2.vipapplicationONLINEONLINEraw2
4)配置这个服务自启动
[oracle@raw2bin]$srvctlenableservice-draw-sdmm
PRKP-1018:Servicedmmalreadyenabled.
5)启动服务
[oracle@raw2bin]$srvctlstartservice-draw-sdmm
6)确认服务状态。Online说明已启动
[oracle@raw2bin]$crs_stat-t
NameTypeTargetStateHost
------------------------------------------------------------
ora.raw.dbapplicationONLINEONLINEraw1
ora.raw.dmm.csapplicationONLINEONLINEraw1
ora....aw1.srvapplicationONLINEONLINEraw1
ora.raw.raw.csapplicationONLINEONLINEraw1
ora....w1.instapplicationONLINEONLINEraw1
ora....w2.instapplicationONLINEONLINEraw2
ora....SM1.asmapplicationONLINEONLINEraw1
ora....W1.lsnrapplicationONLINEONLINEraw1
ora.raw1.gsdapplicationONLINEONLINEraw1
ora.raw1.onsapplicationONLINEONLINEraw1
ora.raw1.vipapplicationONLINEONLINEraw1
ora....SM2.asmapplicationONLINEONLINEraw2
ora....W2.lsnrapplicationONLINEONLINEraw2
ora.raw2.gsdapplicationONLINEONLINEraw2
ora.raw2.onsapplicationONLINEONLINEraw2
ora.raw2.vipapplicationONLINEONLINEraw2
新建的服务会自动添加到初始话参数中:
SQL>showparameterservice
NAMETYPEVALUE
------------------------------------------------------------
service_namesstringraw,dmm
7)用serviceTAF修改配置,需要用dbms_service.Modify_service包。
SQL>Begin
Dbms_service.modify_service(
Service_name=>'dmm',
Failover_method=>dbms_service.failover_method_basic,
Failover_type=>dbms_service.failover_type_select,
Failover_retries=>180,
Failover_delay=>5
);
End;
/
PL/SQLproceduresuccessfullycompleted.
8)确认参数已经生效
SQL>selectname,failover_method,failover_type,goal,clb_goalfromdba_services;
NAMEFAILOVER_METHODFAILOVER_TYPEGOALCLB_G
------------------------------------------------
SYS$BACKGROUNDNONESHORT
SYS$USERSNONESHORT
seeddataXDBLONG
seeddata.regress.rdbLONG
rawXDBLONG
rawLONG
dmmBASICSELECTLONG
7rowsselected.
9)也可以用srvctl命令查看配置情况
[oracle@raw2bin]$srvctlconfigservice-draw-sdmm-a
dmmPREF:raw1AVAIL:raw2TAF:basic
10)删除Service
先关闭service:
[oracle@raw2bin]$srvctlstopservice-draw-sdmm
[oracle@raw2bin]$srvctldisableservice-draw-sdmm
删除服务:
[oracle@raw2bin]$srvctlremoveservice-draw-sdmm
dmmPREF:raw1AVAIL:raw2
Servicedmmisdisabled.
Removeservicedmmfromthedatabaseraw?(y/[n])y
如果该命令清楚不掉,我们可以加上-f参数
[oracle@raw2bin]#./srvctlremoveservice-draw-sdmm-f
OCR中的信息已经被删除了,但是数据字典中的还有该service的内容,继续清除数据字典中的内容。
先查看数据字典内容:
SQL>selectname,failover_method,failover_type,goal,clb_goalfromdba_services;
NAMEFAILOVER_METHODFAILOVER_TYPEGOALCLB_G
---------------------------------------------------------------
SYS$BACKGROUNDNONESHORT
SYS$USERSNONESHORT
seeddataXDBLONG
seeddata.regress.rdbLONG
rawXDBLONG
rawLONG
dmmBASICSELECTLONG
7rowsselected.
清除数据字典里的内容:
SQL>begin
2dbms_service.delete_service(service_name=>'dmm');
3end;
4/
PL/SQLproceduresuccessfullycompleted.
再次查询数据字典,没有了数据。清除完成
SQL>selectname,failover_method,failover_type,goal,clb_goalfromdba_services;
NAMEFAILOVER_METHODFAILOVER_TYPEGOALCLB_G
---------------------------------------------------------------
SYS$BACKGROUNDNONESHORT
SYS$USERSNONESHORT
seeddataXDBLONG
seeddata.regress.rdbLONG
rawXDBLONG
rawLONG
6rowsselected.
How To Configure Server Side Transparent Application Failover [ID 460982.1]
http://blog.youkuaiyun.com/tianlesoftware/archive/2010/12/20/6086728.aspx
10g & 11g Configuration of TAF(Transparent Application Failover) and Load Balancing [ID 453293.1]
http://blog.youkuaiyun.com/tianlesoftware/archive/2010/12/19/6085529.aspx
注:本文整理自张晓明《大话Oracle RAC》
-------------------------------------------------------------------------------------------------------
Blog: http://blog.youkuaiyun.com/tianlesoftware
Email: dvd.dba@gmail.com
DBA1 群:62697716(满); DBA2 群:62697977(满) DBA3 群:62697850(满)
DBA 超级群:63306533(满); DBA4 群: 83829929 DBA5群: 142216823
聊天 群:40132017 聊天2群:69087192
--加群需要在备注说明Oracle表空间和数据文件的关系,否则拒绝申请