Oracle standby的ORA-01578 ORA-01110 ORA-26040 坑爹的NOLOGGING

五一假期对Oracle 11.2.0.1数据库做主备切换后,新主库报错。经分析,报错是因主库中nologging操作使redo未应用到备库datafile,且未启用force logging模式。解决方法是检查NOLOGGING影响,若segment为index则rebuild index,最后强调建立standby要开启强制归档。

异常:

DB: Oracle 11.2.0.1 --版本够low的

五一假期时给用户DB做了switch over主备切换后,用了发现切换后新的主库DB中报错如下:

Wed May 08 09:44:14 2019
Errors in file /u01/product/diag/rdbms/new/orcl/trace/orcl_ora_100843.trc  (incident=50865):
ORA-01578: ORACLE 資料區塊損毀 (檔案編號 126, 區塊編號 4969)
ORA-01110: 資料檔 126: '/data/orcl/smt_idx01.dbf'
ORA-26040: 已使用 NOLOGGING 選項載入資料區塊

Incident details in: /u01/product/diag/rdbms/new/orcl/incident/incdir_50865/orcl_ora_100843_i50865.trc


========= Dump for incident 50865 (ORA 1578) ========

*** 2019-05-08 09:44:14.254
dbkedDefDump(): Starting incident default dumps (flags=0x2, level=3, mask=0x0)
----- Current SQL Statement for this session (sql_id=52s3v0xvc21j8) -----
SELECT
   ROWID, STATION_NUMBER, MACHINE_CODE, PRODUCT_NO,
   VER, EMP_NO, FEEDER_NO,
   KEY_PART_NO, WORK_TIME, SN,
   LINE_NAME, MO_NO, SIDE,
   LOT_NO, VENDOR, DATE_CODE,
   FEEDER_ID, KEY_PART_QTY, HH_PN,
   PACKED_QTY, MFG_PN, PKG_ID,
   CPL_ID, END_TIME, BOM_NO,
   CUST_PN, DIFFERENCE_QTY, USED_QTY
FROM SFISM4.R_SMT_LOG
Where
PKG_ID = 'VCI3011808R05ZI'


分析:

ORA-01578, ORA-01110 第一反应是有数据坏块


使用DBV检查坏块

$dbv file=/data/orcl/smt_idx01.dbf BLOCKSIZE=16384
DBVERIFY: Release 11.2.0.1.0 - Production on Wed May 8 16:15:12 2019
Copyright (c) 1982, 2009, Oracle and/or its affiliates.  All rights reserved.
DBVERIFY - Verification starting : FILE = /data/orcl/smt_idx01.dbf
DBV-00201: Block, DBA 528482373, marked corrupt for invalid redo application
DBV-00201: Block, DBA 528482374, marked corrupt for invalid redo application
DBV-00201: Block, DBA 528482375, marked corrupt for invalid redo application

....


DBVERIFY - Verification complete

Total Pages Examined         : 294400
Total Pages Processed (Data) : 0
Total Pages Failing   (Data) : 0
Total Pages Processed (Index): 259171
Total Pages Failing   (Index): 0
Total Pages Processed (Other): 19965
Total Pages Processed (Seg)  : 0
Total Pages Failing   (Seg)  : 0
Total Pages Empty            : 15264
Total Pages Marked Corrupt   : 3
Total Pages Influx           : 0
Total Pages Encrypted        : 0
Highest block SCN            : 2390574971 (2791.2390574971)

DBV-00201 意味着主库到备库中部分redo没有应用到datafile,


检查切换之前的主库(现在的备库) 果然datafile  '/data/orcl/smt_idx01.dbf' 没有应用

SELECT NAME, UNRECOVERABLE_CHANGE# FROM V$DATAFILE
where UNRECOVERABLE_CHANGE# >0


此类问题通常是因为主库中一些nologging的操作导致redo 没能到备库应用,

结合之前alert.log 的报错“ ORA-26040: 已使用 NOLOGGING 選項載入資料區塊” ,基本确认了这个问题。

难道data guard 没用开到force logging模式导致类似append 操作没用同步?
select force_logging from v$database;

查询 force_logging 为NO还真没用启用 force logging...


解决:

检查 NOLOGGING影响 没用同步datafile对应的segment:
select * from dba_extents
where file_id=126 and 4969 between block_id AND block_id + blocks - 1;

还好segment全部是index,rebuild index即可解决。

注:如果是table 或其它文件需要对原主库(现备库)的datafile backup再至现主库(原备库)中还原恢复了。


最后,老生常谈建立standby,一定记得开启强制归档避免问题发生:

alter database force logging;


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/25583515/viewspace-2643740/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/25583515/viewspace-2643740/

<think>我们面对的是Oracle数据库错误:ORA-10458,ORA-01194,ORA-01110。这些错误通常与数据库恢复、数据文件不一致或SCN(系统变更号)问题相关。根据引用内容,我将逐步分析错误原因并提供解决方法。##错误分析1.**ORA-10458**:表示备用数据库需要恢复。这通常发生在DataGuard环境中,备用数据库无法应用主库传来的日志,导致需要手动干预进行恢复。2.**ORA-01194**:表示文件需要更多的恢复才能保持一致性。这通常是因为恢复过程没有完成,或者日志序列中存在缺口。3.**ORA-01110**:这是一个伴随错误,指出具体哪个数据文件有问题(例如:'/u01/app/oracle/oradata/ORCL/system01.dbf')。根据引用[1][3],这些错误可能由以下原因引起:-介质恢复失败(如归档日志缺失或损坏)-数据库SCN不一致(引用[2])-在尝试打开备用数据库为只读模式时出现问题(引用[3])##解决方案###常规恢复步骤(优先尝试)1.**尝试应用缺失的归档日志**:如果备用数据库缺少归档日志,从主库获取并注册应用:```sqlALTERDATABASEREGISTERLOGFILE'<归档日志路径>';ALTERDATABASERECOVERMANAGEDSTANDBYDATABASEDISCONNECTFROMSESSION;```2.**检查恢复进度**:使用以下命令查看恢复状态:```sqlSELECTPROCESS,STATUS,THREAD#,SEQUENCE#,BLOCK#,BLOCKSFROMV$MANAGED_STANDBY;```###非常规方法(谨慎使用)当常规恢复无法解决问题时,可能需要使用内部参数强制打开数据库(引用[2][4][5])。**注意:此操作可能导致数据不一致,仅作为最后手段。**1.**设置内部参数**:修改参数`_allow_resetlogs_corruption`(允许以不一致状态打开数据库):```sqlALTERSYSTEMSET"_allow_resetlogs_corruption"=TRUESCOPE=SPFILE;```2.**重启数据库并重置日志**:```sqlSHUTDOWNIMMEDIATE;STARTUPMOUNT;--执行不完全恢复RECOVERDATABASEUNTILCANCEL;--输入CANCEL中断恢复ALTERDATABASEOPENRESETLOGS;--强制打开```3.**后续操作**:打开数据库后立即执行全库备份(因为此时数据库处于不一致状态)。重建备库(如果是DataGuard环境)。##预防措施-**确保归档日志完整传输**:监控主备库的归档日志传输状态。-**定期验证备库**:使用`DBVERIFY`或`RMANVALIDATE`检查数据文件完整性。-**避免强制关机**:异常关机可能导致SCN不一致。>**警告**:使用`_allow_resetlogs_corruption`会破坏数据一致性,只应在无法恢复且数据可丢弃的场景下使用(如测试环境)。生产环境务必联系Oracle支持。##相关问题1.如何监控OracleDataGuard的归档日志传输状态?2.使用`_allow_resetlogs_corruption`打开数据库后,如何重建一个干净的备库?3.OracleSCN不一致的常见原因及预防措施有哪些?</think>### ORA-10458, ORA-01194, ORA-01110 错误原因及解决方法 #### **错误本质** 这些错误共同指向**数据库文件不一致**问题,通常由以下原因导致: 1. **恢复中断**:备用数据库恢复过程未完成(如归档日志缺失/损坏)导致文件不一致[^1][^3] 2. **SCN不一致**:主备数据库的系统变更号(SCN)差异过大,使备库无法同步主库状态[^2][^5] 3. **文件损坏**:物理存储故障导致数据文件异常(如 ORA-01110 明确指向的 system01.dbf 文件)[^1] 4. **异常关机**:数据库强制关闭导致事务未完整提交[^5] --- #### **解决方案** ##### **常规恢复流程** ```sql -- 1. 尝试完成介质恢复 RECOVER DATABASE USING BACKUP CONTROLFILE; -- 2. 应用所有可用归档日志 ALTER DATABASE RECOVER MANAGED STANDBY DATABASE DISCONNECT; -- 3. 若报错显示缺失日志,从主库复制并注册 ALTER DATABASE REGISTER PHYSICAL LOGFILE '<归档日志路径>'; ``` ##### **紧急恢复方案(数据可丢失场景)** > **警告**:此操作可能导致数据损坏,仅作为最后手段[^2][^4] ```sql -- 1. 启用内部参数(需重启) ALTER SYSTEM SET "_allow_resetlogs_corruption"=TRUE SCOPE=SPFILE; -- 2. 重启到mount状态 SHUTDOWN IMMEDIATE; STARTUP MOUNT; -- 3. 强制打开数据库 ALTER DATABASE OPEN RESETLOGS; -- 将重置日志序列[^4] ``` ##### **后续必要操作** 1. **立即全库备份**:强制打开后数据库处于不一致状态,必须执行 `RMAN FULL BACKUP`[^4] 2. **重建备库**:建议重新搭建Data Guard环境[^5] 3. **验证文件完整性**: ```sql ALTER DATABASE VALIDATE DATAFILE 1; -- 检查ORA-01110指定的文件 ``` --- #### **预防措施** 1. **监控归档间隙**:定期检查 `V$ARCHIVE_GAP` 2. **启用实时应用**:备库配置 `ALTER DATABASE RECOVER MANAGED STANDBY DATABASE USING CURRENT LOGFILE` 3. **存储冗余**:确保数据文件存储在RAID或ASM磁盘组 4. **SCN监控**:主库执行 `SELECT CURRENT_SCN FROM V$DATABASE;` 与备库对比 > **关键提示**:生产环境使用 `_allow_resetlogs_corruption` 前务必联系Oracle支持,该操作会标记数据库为"已损坏"[^2][^4]。 --- ### 相关问题 1. 如何检测Oracle Data Guard的主备SCN差异? 2. 使用 `_allow_resetlogs_corruption` 后,为什么必须立即重建备库? 3. Oracle归档日志缺失时,除了恢复还有哪些应急方案? 4. 如何配置RMAN验证数据文件完整性的自动化任务? 5. 在云环境(如阿里云)部署Data Guard有哪些特殊注意事项?
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值