控制文件的备份与还原
本人是一名在校大三学生,刚入门Oracle数据库,有什么地方写的不对的,在这里,希望访问的IT同行给出建议评论,谢谢
控制文件是ORACLE数据库最重要的物理文件之一,每个oracle数据库都必须至少有一个控制文件。在启动数据库实例时,oracle会根据初始化参数查找到控制文件,并读取控制文件中的信息(如数据库名称、数据文件,日志文件的名称及位置等)在实例和数据库之间建立起关联。
控制文件损坏的后果
每当进程读取读取控制文件内容时,读的总是第一个控制文件(第一个指的是control_files初始化参数中定义的第一个文件),所以当第一个控制文件损坏时,读写操作都会出错;而当第一个控制文件以外的其他控制文件出问题时,只有写操作出错,读操作正常,这也意味着,有时候数据库出现假死状态,oracle中的错误必须触发才能报错。
由于控制文件在数据库中的重要地位,所以保护控制文件的安全非常重要,为此oracle系统提供了备份文件和多路复用的机制。
控制文件的多路复用在数据库中的使用
可以看出此时数据库物理层有两个控制文件
此时可以看到数据库有三个控制文件,数据库正常启动,并且这三个控制文件的内容一模一样
这就是控制文件的多路复用技术。
控制文件的多路复用
SYS@openlab> alter system set control_files=’/u01/app/oracle/oradata/orcl/control01.ctl’,’/u01/app/oracle/oradata/orcl/control02.ctl’,’/u01/app/oracle/oradata/orcl/control03.ctl’ scope=spfile;
System altered.
SYS@openlab> shutdown immediate;
[oracle@instructor ~]$ cd /u01/app/oracle/oradata/orcl/
[oracle@instructor orcl]$ cp control01.ctl control03.ctl
SYS@openlab> startup
ORACLE instance started.
Total System Global Area 1419685888 bytes
Fixed Size 2253224 bytes
Variable Size 1073745496 bytes
Database Buffers 335544320 bytes
Redo Buffers 8142848 bytes
Database mounted.
Database opened.
SYS@openlab> select name from v$controlfile;
NAME
/u01/app/oracle/oradata/orclcontrol01.ctl
/u01/app/oracle/oradata/orclcontrol02.ctl
/u01/app/oracle/oradata/orclcontrol03.ctl
启动实例时发现损坏
启动实例时进程既要读控制文件也要写控制文件,既然写操作即要写所有的控制文件,也就是说,启动实例时所有的控制文件缺一不可。虽然此时的控制文件有三个,查看此时的控制文件参数,
SQL> show parameter control_file;
NAME TYPE
VALUE
control_file_record_keep_time integer
7
control_files string
/u01/app/oracle/oradata/orcl/c
ontrol01.ctl, /u01/app/oracle/
oradata/orcl/control02.ctl, /u
01/app/oracle/oradata/orcl/con
trol03.ctl
只要其中任意一个控制文件出现问题,实例就
拒绝MOUNT。因此,startup命令只能将数据库启动到NOMOUNT 状态,伴随有“ORA-00205(识别控制有误)”或“ORA-00227(控制文件存在坏块)”。
ORA-00205:error in identifying control file ,check alert log for more info;
ORA-00227:corrupt block detected in control file:(block 0 #blocks)
实例运行时发现损坏
如果任意一个控制文件在实例运行时损坏,实例起先能够保持在OPEN状态,但不保证所有功能可以正常进行,此时数据库处于假死状态,有些操作可以继续使用,而有些操作则立即报错。当然,最终逃不了实例被强制关闭的命(自动或手动)。首先发现错误的极有可能是CKPT进程(该进程每3秒就会写一下控制文件)。
备份控制文件
此篇文章,只因为本人是一个刚入ORACLE数据库的小白,在这就只简单说一下,部分自动备份和手动备份控制文件。
说起备份,不得不提到Oracle的RMAN (Recovery Manager) 全称为备份与恢复管理器。RMAN 是备份、恢复数据的首选工具。
自动备份;
RMAN> show controlfile autobackup;
using target database control file instead of recovery catalog
RMAN configuration parameters for database with db_unique_name ORCL are:
CONFIGURE CONTROLFILE AUTOBACKUP OFF; # default
RMAN> CONFIGURE CONTROLFILE AUTOBACKUP On;
RMAN configuration parameters for database with db_unique_name ORCL are:
CONFIGURE CONTROLFILE AUTOBACKUP ON;
开启以上功能,oracle就会在以下两种情况悄悄地一备份集方式备份数据库控制文件。
- 用RMAN命令执行任何备份操作导致控制文件内RMAN资料库被更新后。
- 数据库物理结构发生变化之后,比如,添加数据文件。
现在备份一下user表空间,backup命令中并未对控制文件备份,看看数据库是如何自动备份表空间的。RMAN> backup tablespace users;
Starting backup at 22-JAN-19
using target database control file instead of recovery catalog
allocated channel: ORA_DISK_1
channel ORA_DISK_1: SID=36 device type=DISK
channel ORA_DISK_1: starting full datafile backup set
channel ORA_DISK_1: specifying datafile(s) in backup set
input datafile file number=00004 name=/u01/app/oracle/oradata/orcl/users01.dbf
channel ORA_DISK_1: starting piece 1 at 22-JAN-19
channel ORA_DISK_1: finished piece 1 at 22-JAN-19
piece handle=/u01/app/oracle/archive_dest/ORCL/backupset/2019_01_22/o1_mf_nnndf_TAG20190122T040222_g4d9bh14_.bkp tag=TAG20190122T040222 comment=NONE
channel ORA_DISK_1: backup set complete, elapsed time: 00:00:01
Finished backup at 22-JAN-19
Starting Control File and SPFILE Autobackup at 22-JAN-19
piece handle=/u01/app/oracle/archive_dest/ORCL/autobackup/2019_01_22/o1_mf_s_998193744_g4d9bjtq_.bkp comment=NONE
Finished Control File and SPFILE Autobackup at 22-JAN-19
以上黑体就是备份完数据文件 tablespace users之后,备份的控制文件以及参数文件。
手动备份
备份集备份
和其他类型文件一样,控制文件也可通过RMAN的backup命令备份为备份集,例如;
RMAN> backup as backupset current controlfile;
Starting backup at 22-JAN-19
using channel ORA_DISK_1
channel ORA_DISK_1: starting full datafile backup set
channel ORA_DISK_1: specifying datafile(s) in backup set
including current control file in backup set
channel ORA_DISK_1: starting piece 1 at 22-JAN-19
channel ORA_DISK_1: finished piece 1 at 22-JAN-19
piece handle=/u01/app/oracle/archive_dest/ORCL/backupset/2019_01_22/o1_mf_ncnnf_TAG20190122T041109_g4d9tygm_.bkp tag=TAG20190122T041109 comment=NONE
channel ORA_DISK_1: backup set complete, elapsed time: 00:00:01
Finished backup at 22-JAN-19
Starting Control File and SPFILE Autobackup at 22-JAN-19
piece handle=/u01/app/oracle/archive_dest/ORCL/autobackup/2019_01_22/o1_mf_s_998194271_g4d9tzqq_.bkp comment=NONE
Finished Control File and SPFILE Autobackup at 22-JAN-19
不指定位置的的话,就自动保存在快速恢复区中。
恢复控制文件
确保以下查询有值,有大小
SQL> show parameter db_recovery;
NAME TYPE VALUE
db_recovery_file_dest string /u01/app/oracle/archive_dest
db_recovery_file_dest_size big integer 4122M
本篇文章的控制文件恢复是在其他数据文件,参数文件都健康的前提下。
恢复前的准备
为了恢复控制文件,实例应该处于NOMOUNT状态。如果发现问题时实例还未关闭,首先应该使用”shutdown abort“命令关闭实例,接着虽然可以使用”startup nomount“命令,但建议使用startup命令启动实例,使其自然卡在”NOMOUNT“状态,这样做可能会在警告日志和追踪日志中产生更多的有价值的信息,并且对使用数据恢复顾问也有好处。NOMOUNT状态需要参数文件,本篇文章都是在参数文件健康的前提下进行的。
利用在线镜像备份恢复
SQL> select name from v$controlfile;
NAME
/u01/app/oracle/oradata/orcl/control01.ctl
/u01/app/oracle/oradata/orcl/control02.ctl
/u01/app/oracle/oradata/orcl/control03.ctl
此时的数据库已不能正常关闭
SQL> shutdown immediate;
Database closed.
ORA-00210: cannot open the specified control file
ORA-00202: control file: ‘/u01/app/oracle/oradata/orcl/control01.ctl’
ORA-27041: unable to open file
Linux-x86_64 Error: 2: No such file or directory
Additional information: 3
只能shutdown abort关库;
重新启动数据库只能启动到 NOMOUNT状态
查看数据库告警日志
ORA-00210: cannot open the specified control file
ORA-00202: control file: ‘/u01/app/oracle/oradata/orcl/control01.ctl’
ORA-27037: unable to obtain file status
Linux-x86_64 Error: 2: No such file or directory
Additional information: 3
ORA-205 signalled during: ALTER DATABASE MOUNT…
Tue Jan 22 04:39:56 2019
Checker run found 1 new persistent data failures
查看后是control01.ctl 文件丢失,用操作系统命令使用在线的健康的控制文件替换已损坏或已丢失的控制文件。
恢复的主要流程:
-
使用startup开启数据库到NOMOUNT状态。
-
使用告警日志查看控制文件的损坏的具体情况。 tail -f alert_orcl.log
-
用操作系统命令使用在线的健康的控制文件替换已损坏或已丢失的控制文件。
-
启动数据库到MOUNT状态。alter database mount
-
启动数据库到open状态。alter database open
利用自动备份恢复
如果自动备份可用,恢复的流程如下:
- 使用startup 命令启动实例到NOMOUNT状态。
- 运行 restore controlfile from autobackup 命令还原控制文件。
- 令实例进入MOUNT状态。
- 用recover database 命令恢复数据库。
- 用 resetlogs 命令打开数据库。
当数据库处于open状态时无法连接rman,因其此时需要control file,
没有控制文件,无法生成检查点,故只能使用shutdown abort关闭
SQL> shutdown abort;
ORACLE instance shut down.
没有控制文件,只能启动到nomount阶段。
SQL> startup
ORACLE instance started.
Total System Global Area 559517696 bytes
Fixed Size 2230312 bytes
Variable Size 364906456 bytes
Database Buffers 188743680 bytes
Redo Buffers 3637248 bytes
ORA-00205: error in identifying control file, check alert log for more info
SYS> select status from v$instance;
STATUS
STARTED
启动rman恢复
在进入NOMOUNT状态之后,连接RMAN,用" restore controlfile from autobackup"命令将控制文件从自动备份中还原出来。该命令充分展现了快恢复区的优越性。
[oracle@localhost orcl]$ rman target /
Recovery Manager: Release 11.2.0.3.0 - Production on Tue Jan 22 16:59:45 2019
Copyright © 1982, 2011, Oracle and/or its affiliates. All rights reserved.
connected to target database: ORCL (not mounted)
RMAN> restore controlfile from autobackup;
Starting restore at 22-JAN-19
using target database control file instead of recovery catalog
allocated channel: ORA_DISK_1
channel ORA_DISK_1: SID=17 device type=DISK
recovery area destination: /u01/app/oracle/archive_dest
database name (or database unique name) used for search: ORCL
channel ORA_DISK_1: AUTOBACKUP /u01/app/oracle/archive_dest/ORCL/autobackup/2019_01_22/o1_mf_s_998194271_g4d9tzqq_.bkp found in the recovery area
AUTOBACKUP search with format “%F” not attempted because DBID was not set
channel ORA_DISK_1: restoring control file from AUTOBACKUP /u01/app/oracle/archive_dest/ORCL/autobackup/2019_01_22/o1_mf_s_998194271_g4d9tzqq_.bkp
channel ORA_DISK_1: control file restore from AUTOBACKUP complete
output file name=/u01/app/oracle/oradata/orcl/control01.ctl
output file name=/u01/app/oracle/oradata/orcl/control02.ctl
output file name=/u01/app/oracle/oradata/orcl/control03.ctl
Finished restore at 22-JAN-19
是数据库进入MOUNT状态:
RMAN> mount database;
database mounted
released channel: ORA_DISK_1
恢复数据库:
RMAN> recover database ;
Starting recover at 22-JAN-19
Starting implicit crosscheck backup at 22-JAN-19
allocated channel: ORA_DISK_1
channel ORA_DISK_1: SID=17 device type=DISK
Crosschecked 3 objects
Finished implicit crosscheck backup at 22-JAN-19
Starting implicit crosscheck copy at 22-JAN-19
using channel ORA_DISK_1
Finished implicit crosscheck copy at 22-JAN-19
searching for all files in the recovery area
cataloging files…
cataloging done
List of Cataloged Files
File Name: /u01/app/oracle/archive_dest/ORCL/autobackup/2019_01_22/o1_mf_s_998194271_g4d9tzqq_.bkp
using channel ORA_DISK_1
starting media recovery
archived log for thread 1 with sequence 3 is already on disk as file /u01/app/oracle/oradata/orcl/redo03.log
archived log file name=/u01/app/oracle/oradata/orcl/redo03.log thread=1 sequence=3
media recovery complete, elapsed time: 00:00:01
Finished recover at 22-JAN-19
alter database open resetlogs;
database opened
恢复至此结束
利用手动备份恢复
利用手动备份恢复的流程:
- 启动数据库实例到NOMOUNT 状态。
- 搜素备份集的位置。
- 用指定备份集路径的”restore controlfile from ‘<备份路径>’“命令还原控制文件。
- 令实例进入到MOUNT 状态。
- 用recover database命令恢复数据库。
- 用restlogs 选项打开数据库。
过程和利用自动备份的过程大同小异
只是第三步有所不同
在 RMAN 中使用” list backup“命令找到最近的一次控制文件备份路径。
根据上面的三步骤往下执行就OK。