ORA-29740:evicted by member %d, group incarnation %d

本文探讨了Oracle RAC环境下ORA-29740错误的原因及解决思路,详细分析了不同reason值对应的可能问题,并提供了查找日志的具体步骤。
Normal 0 7.8 磅 0 2 false false false MicrosoftInternetExplorer4 ORA-29740: evicted by member %d, group incarnation %d

这个错误是在 rac 底下出现的,应该算是个比较严重的错误,就是 某个节点 踢(evict)出去了,导致这个节点重启系统。

这个错误的原因多种多样,而且需要找的日志文件也是很多的,基本上,能找的日志都要找过去,直到能基本确定 问题根源为止,不过,这里有个指导性的 解决思路。

当出现 ORA-29740 的错误时,一般会伴随着如下内容:

Fri Sep 28 17:11:51 2001

Errors in file /oracle/export/TICK_BIG/lmon_26410_tick2.trc:

ORA-29740: evicted by member %d, group incarnation %d

Fri Sep 28 17:11:53 2001

Trace dumping is performing id=[cdmp_20010928171153]

Fri Sep 28 17:11:57 2001

Instance terminated by LMON, pid = 26410

这时,我们需要去查看 LMON trace 文件,而在 trc 文件中,比较重要的部分是:

*** 2002-11-20 18:49:51.369

       kjxgrdtrt: Evicted by 0, seq (3, 2)

                              ^

                              |

This indicates which instance initiated the eviction.(这个表明这个节点是被哪个节点踢)

On the evicting instance we will see something like:

       kjxgrrcfgchk: Initiating reconfig, reason 3

       *** 2002-11-20 18:49:29.559

       kjxgmrcfg: Reconfiguration started, reason 3

       ...

       *** 2002-11-20 18:49:29.727

       Obtained RR update lock for sequence 2, RR seq 2

       *** 2002-11-20 18:49:31.284

       Voting results, upd 0, seq 3, bitmap: 0

       Evicting mem 1, stat 0x0047 err 0x0002

重点关注 reason n 这个数字,因为 每个 reason 基本上对应不同的 错误内容:

Reason 0 = No reconfiguration 

Reason 1 = The Node Monitor generated the reconfiguration.

Reason 2 = An instance death was detected.

Reason 3 = Communications Failure

Reason 4 = Reconfiguration after suspend

 

这里,介绍下 reason 1,2,3

Reason 1 一般是由于 增加或删除rac 节点成员产生的,一般情况下,不会产生 reason 的问题。

Reason 2 一般是由于

a) NTP (Time changes on cluster) - usually on Linux, Tru64, or IBM AIX

b) Network Problems (SAN).

c) Resource Starvation (CPU, I/O, etc..)

d) An Oracle bug.

这个错误没有明显的 判断标准,只能查看 各个 日志来判断可能引起的原因

 

Reason 3 一般是由于

a) Network Problems.

b) Resource Starvation (CPU, I/O, etc..)

c) Severe Contention in Database.

d) An Oracle bug.

这个错误很可能是由于节点间的通信造成的,所以,首先先看看节点间的通信是否有问题。

 

参考文档:

MetalinkID 219361.1

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/14730395/viewspace-682815/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/14730395/viewspace-682815/

<think>嗯,用户这次询问的是Oracle数据库导出过程中的一系列错误代码解决方案。结合提供的三个引用资料来看,用户遇到的是expdp导出时常见的复合型错误:ORA-31693(表数据卸载失败)实际是结果性报错,核心问题在于ORA-02354(导出过程异常)和ORA-01555(快照过旧),偶尔伴随ORA-22924(快照过旧的特殊形态)。 用户可能正在执行数据库迁移或备份任务,从引用[3]提到的105GB大表导出失败来看,业务规模不小。ta连续遇到多个同类错误,说明不是偶发现象,需要系统化解决。尤其值得注意的是引用[1]和[3]都指向视图/同义词解析问题和大事务回滚段配置不足这两类根源。 深层需求其实是保证数据导出任务的可靠性。用户没有明说但可能隐含的痛点包括:生产环境停机时间有限、数据一致性要求高、以及对Oracle内部机制不熟悉带来的排查困难。 技术层面需要分三层处理: 首先是紧急应对措施,比如针对ORA-01555错误立即扩大UNDO表空间或调整参数,这类方案能在数分钟内生效; 其次要解决结构性问题,比如引用[1]提到的视图导出失败需要重建元数据; 最后是预防性优化,像引用[2][3]都提到的UNDO保留时间调整和大事务拆分策略。 特别要注意引用[3]揭示的陷阱——当导出大表时,如果存在并发DML操作,即使UNDO表空间总量足够,也可能因快照保留时间不足导致失败。这需要综合运用UNDO_RETENTION参数优化和导出时机的选择。 用户提供的错误代码组合很典型,正好构成完整的故障链条:ORA-02354是导出的通用异常包装器,ORA-31693是被跳过对象的报告,真正致命的底层错误是ORA-01555及其变种ORA-22924。这个诊断结论应该明确传达给用户。 </think>以下是针对Oracle数据库错误代码 **ORA-31693、ORA-02354、ORA-01555 和 ORA-22924** 的综合解决方案,结合引用内容和Oracle官方建议整理: --- ### **错误原因分析** 1. **ORA-31693 + ORA-02354** - 通常在`expdp`导出时发生,表示特定表(如 `YKSOFT.T_TEMP_U90915`)因元数据问题无法导出。 - **核心问题**:尝试导出**视图或同义词**(而非实际表),或对象元数据损坏(引用[1][^1])。 2. **ORA-01555: snapshot too old** - 导出过程中查询的数据版本被覆盖,因UNDO表空间不足或事务保留时间过短(引用[2][^2][^3])。 - 常见于导出超大表时(如引用[3]中105GB的表)。 3. **ORA-22924: snapshot too old** -ORA-01555的衍生错误,通常与LOB字段导出相关(引用[2][^2])。 --- ### **解决方案步骤** #### **1. 修复元数据问题(针对ORA-31693 + ORA-02354)** ```sql -- 检查对象类型(确认是表/视图/同义词) SELECT object_name, object_type FROM dba_objects WHERE owner='YKSOFT' AND object_name='T_TEMP_U90915'; -- 若为视图/同义词:重建或替换为实体表 CREATE TABLE YKSOFT.T_TEMP_U90915_ACTUAL AS SELECT * FROM T_TEMP_U90915; -- 导出新表替代原对象 ``` #### **2. 解决ORA-01555 / ORA-22924(快照过旧)** - **增大UNDO表空间**: ```sql ALTER TABLESPACE UNDOTBS1 ADD DATAFILE '/path/undotbs02.dbf' SIZE 10G AUTOEXTEND ON; ``` - **延长UNDO保留时间**: ```sql ALTER SYSTEM SET UNDO_RETENTION = 1800; -- 单位:秒(建议≥导出耗时) ``` - **优化导出参数**: ```bash expdp user/pwd DIRECTORY=dpump_dir DUMPFILE=exp.dmp LOGFILE=exp.log FLASHBACK_TIME=SYSTIMESTAMP -- 使用闪回保证一致性 PARALLEL=4 -- 降低并行度减少UNDO压力 ``` #### **3. 分治策略导出大表** - **单独导出失败的表**(避免全局失败): ```bash expdp user/pwd TABLES=SJTBK.INC_KETTLE_ETL_HIST, SJTBK.ECPS_EASY_LOGOUT DIRECTORY=dpump_dir DUMPFILE=large_tables.dmp ``` - **使用`QUERY`条件分批导出**: ```bash expdp ... QUERY="WHERE ROWNUM<=1000000" -- 分批导出 ``` #### **4. 预防性措施** - **监控UNDO使用**: ```sql SELECT BEGIN_TIME, TUNED_UNDORETENTION FROM V$UNDOSTAT; ``` - **避免导出高峰期操作**:减少并发DML对UNDO的争用。 - **改用物理备份**:对百GB级数据,RMAN比逻辑导出更可靠(引用[2][^2])。 --- ### **关键要点总结** | 错误码 | 主因 | 解决方案 | |-----------------|-----------------------|-----------------------------| | ORA-31693+02354 | 视图/同义词元数据异常 | 重建对象或导出实体表 | | ORA-01555 | UNDO空间或保留时间不足| 增大UNDO、延长保留时间 | | ORA-22924 | LOB字段导出快照过旧 | 分批导出+优化UNDO参数 | > ⚠️ 若问题持续,检查`alert.log`获取更详细的堆栈信息,并考虑使用Oracle Support收集诊断数据(RDA工具)[^3]。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值