
Oracle故障诊断案例
inthirties
程序员紫龙,喜欢编程,热爱编程的老年程序员
展开
-
RAC的问题二
RAC的问题二接着上面的帖解决上面的问题,RAC实例还是只能在inthrac01节点上启动,检查crs在inthrac的状态crsctl check crs发现crs不健康检查crs和css进程ps -ef | grep crsps -ef | grep css有两个进程,但是都是check状态。 分析,这里很明显是共享磁盘的原创 2010-01-21 12:46:00 · 809 阅读 · 0 评论 -
WARNING: Subscription node down event still pending
WARNING: Subscription for node down event still pending以前没在意,今天查了一下,原来是因为 10G 中的 ONS,可以通过配置 listener 的参数SUBSCRIBE_FOR_NODE_DOWN_EVENT=OFF 屏蔽掉,对 listener 的功能没有影响。Listener Subscription原创 2010-03-10 14:05:00 · 2503 阅读 · 0 评论 -
查看process占用的内存数
查看process占用的内存数http://inthirties.com:90/thread-1032-1-1.html我们在管理processes和pga分配内存大小的时候,通常要考虑到每个process占用的大小,然后根据这个大小来决定我们的PGA分配多大,我们的processes要定义为多大。那么如何查看一个连接占用内存大小当客户端建立一个连接原创 2010-03-12 13:31:00 · 1467 阅读 · 0 评论 -
RMAN环境变量的修改时间显示设置
RMAN的时间格式是从环境变量NLS_DATE_FORMAT读取的。 export NLS_DATE_FORMAT=YYYY-MM-DD HH24:MI:SS 就可以修改我们在RMAN里看到的时间显示方式了 比如 BS Key Type LV Size Device Type Elapsed Time Completion Time ------- ---- -- ----------原创 2009-12-29 22:35:00 · 1529 阅读 · 1 评论 -
PRKP-1037 failed to create cluster database xXX
细心的朋友,发现了inthirties的论坛的名字换成了 把问题当作机会这是我对Oracle的学习和服务过程中的态度,其实我有时很期盼Oracle出现错误,这样会激发我更多的学习的欲望,上面的问题也是如此。确实很怪异,当我改了一个名字以后,确实就成功的创建了RAC的实例。虽然安装还是成功了,但是我觉得改个名字就能成功,是名字导致的问题,这个确实太难以让人信服叻。原创 2010-01-08 09:04:00 · 2299 阅读 · 0 评论 -
em的错误
本文出自 “inthirties(男人三十)”博客,转载请务必注明作者和保留出处。http://inthirties.com:90/thread-1275-1-1.htmlem启动不了,朋友感到是个小问题,在网上找了好多资料都没有对上症状,只好向我告急。启动em,提示OC4J的一个目录找不到。/u01/app/oracle/produ原创 2010-03-23 01:22:00 · 2134 阅读 · 0 评论 -
ORA-16136: Managed Standby Recovery not active
http://inthirties.com:90/viewthread.jsp?tid=1270&frombbs=1* 本文出自 “inthirties(男人三十)”博客,转载请务必注明作者和保留出处。一个朋友学习Dataguard,在打开备库的时候出现错误,错误如下ORA-16136: Managed Standby Recovery not active原创 2010-03-21 19:53:00 · 8447 阅读 · 0 评论 -
ORA-00376: file 1 cannot be read at this time
碰到这个错误ORA-00376: file 1 cannot be read at this time重启数据库不能成功。alert文件里没有什么信息。试着重建了控制文件,成功。感觉有些奇怪,特此记一下。原创 2010-03-21 20:57:00 · 2393 阅读 · 0 评论 -
OCR与Voting Disk以及其管理
http://inthirties.com:90/thread-1306-1-1.htmlOracle Clusterware由2部分组成,分别是Voting Disk和 OCR。Voting Disk里面记录着节点成员的信息。如RAC数据库中有哪些节点成员,节点增加或者删除时也同样会将信息记录进来。Voting Disk必须存放在共享存储上,通常来说是存放在裸设备上原创 2010-03-30 11:04:00 · 4479 阅读 · 0 评论 -
这段时间做了几把RAC的故障恢复
这段时间做了几把RAC的故障恢复 给某证券公司的RAC进行了一次故障排查和恢复。该证券公司RAC瘫痪,用户不能登录,连sysdba也不能登录。CRS体系出现故障,通过对CRS的故障进行排查,找到一系列综合性的导致了这次的RAC实例宕机的原因,然后修复CRS体系,同时修复实例上的故障,最后对实例进行恢复,从容使系统重新上线使用。 给某ERP系统的RAC进行了故障恢复,这个是相对上面故障稍微简原创 2009-12-28 21:31:00 · 1087 阅读 · 0 评论 -
v$log管理的深入研究
v$log是用来反映redo log file的数据字典。这个数据字典对于我们了解redo log当前的工作状态有比较多的意义。我们先来看看该视图的信息吧SQL> desc v$log; Name Null? Type ------------------------------原创 2009-12-28 13:54:00 · 2687 阅读 · 2 评论 -
遭遇ORA-600错 参数: [keltnfy-ldmInit]
遭遇ORA-600错 参数: [keltnfy-ldmInit]今天一个朋友的Oracle遭遇ORA-600错当startup运行的时候Oracle出错,ORA-600的错。错误如下,ORA-00600: 内部错误代码, 参数: [keltnfy-ldmInit], [46], [1], [], [], [], [], []这个错,在nomount启动的原创 2010-01-24 21:34:00 · 1107 阅读 · 0 评论 -
连接RAC主机ORA-12545错误解决方法
在RAC环境下,客户端连接总是感觉不稳定,时不时就给你来个ORA-12545: 因目标主机或对象不存在, 连接失败相信很多有RAC方面应用的朋友都遇见过这个问题了。解决的方法就指定local_listener如下:在第一个节点指定其local_listener为自己本机例如SQL> alter system set local_l原创 2010-01-24 23:12:00 · 6051 阅读 · 0 评论 -
NTP的问题 no server suitable for synchronization found
今天配置ntp服务器客户端在同步时间的时候总是提示错误 [root@inth-rac02 ~]# ntpdate 192.168.47.135 29 Nov 23:13:35 ntpdate[8107]: no server suitable for synchronization found 开始以为是防火墙的问题,把防火墙关闭 [root@inth-rac02 ~]# service i原创 2009-12-01 20:48:00 · 7106 阅读 · 0 评论 -
NFS操作提示没有权限 Permission denied
在尝试用NFS建立RAC的时候,出现一个问题 /etc/exports的配置如下 /share *(rw,sync) 其中一个主机查询NFS共享情况 [root@inthirties03 ~]# exportfs -av exporting *:/share [root@inthirties04 test]# showmount -e 192.168.47.128 Export list for原创 2009-12-01 20:50:00 · 6763 阅读 · 1 评论 -
crs启动失败故障的解决实例
接到一个客户的电话,crs启动失败。登录客户的机器,对于crs的错误排查,从系统日志着手在系统日志里有如下有关crs失败的信息Jan 29 20:25:59 inthrac01 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7004.Jan 2原创 2010-01-29 21:30:00 · 4938 阅读 · 0 评论 -
ORA-16053: DB_UNIQUE_NAME string is not in the Data Guard Configuration的解决
Oracle Error : ORA-16053: DB_UNIQUE_NAME string is not in the Data Guard ConfigurationCause: The specified DB_UNIQUE_NAME is not in the Data Guard Configuration.Action: If the DG_CONFIG at原创 2010-03-08 08:57:00 · 2238 阅读 · 0 评论 -
VIPCA failes with CRS-0215 wrror for ons
vipca遇到CRS-0215,Could not start onsOracle 10.2.0.4 , 64bit, Linux AS 5.3 , 2 nodes .当我们在安装Clusterware 的时候, 需要在第二节点上vipca , 配置到最后安装的时候, 安装到 75% 左右,报错:CRS-0215 : Could not start res原创 2010-03-05 22:52:00 · 2151 阅读 · 0 评论 -
很不错的工具kfod 查看Oracle ASM磁盘信息
这个工具可以用于手工查询ASM磁盘的信息。其帮助信息如下:[oracle@localhost ~]$ which kfod/u01/oracle/product/10.2.0.1/db_1/bin/kfod[oracle@localhost ~]$ kfod -h_asm_a/llow_only_raw_disks KFOD all原创 2009-12-28 11:36:00 · 1529 阅读 · 0 评论 -
这个诡异的RAC宕机
又遇到RAC宕机,特别的诡异,只所以诡异叻,是因为实在是没有很有价值的错误日志可以进行参考。首先系统日志,没有任何有关系统的异常,crs信息,也是一切OK。不过在ocssd.log里看到crs出错后,dump出来的信息。在dump之前有一个提示 from con(d940a0) proc(d89310) pid() proto(10:2:1原创 2010-04-13 15:54:00 · 1249 阅读 · 0 评论 -
00261, 00000, “log %s of thread %s is being archived or modified”
http://inthirties.com:90/thread-1417-1-1.html在database guard上,做failover的时候,有时候会遭遇到ORA-00261的错误。查一下error [oracle@solaris ~]oerr ORA 00261 00261, 00000, “log %s of th原创 2010-04-15 00:41:00 · 815 阅读 · 0 评论 -
延迟块清除
在Oracle中数据锁(这里主要指TX类型行锁)实际上是数据的属性,存储在块首部,称之为事务槽(ITL)。COMMIT操作的职责包括释放块上的锁,实际的释放方式即清除块上相应的事务槽,但这里存在一个性能的考量。设想一个UPDATE大量数据的操作,因为执行时间较长,一部分已修改的块已被缓冲池flush out写至磁盘,当UPDATE操作完成执行COMMIT操作时,则需要将那些已写至磁盘的原创 2010-04-14 16:34:00 · 1913 阅读 · 0 评论 -
Memory Notification: Library Cache Object loaded into SGA
Just a warning is found in my alert log file.As below:Memory Notification: Library Cache Object loaded into SGAHeap size 2250K exceeds notification threshold (2048K)Details in trace file /u01/oracle/admin/sample/udump/sample_ora_16462.trcKGL object n原创 2010-06-02 13:44:00 · 1596 阅读 · 0 评论 -
11gR2 RAC一个错误处理过程
2010-06-08 22:56:33.127: [ GPnP][3085908288]clsgpnp_getCK: [at clsgpnp0.c:1965] Result: (0) CLSGPNP_OK. Get gpnp wallet - provider 1 of 2 (LSKP-FSW(1))2010-06-08 22:56:33.127: [ GPnP][3085908288]clsgpnp_getCK: [at clsgpnp0.c:1982] Got gpnp security原创 2010-06-08 23:44:00 · 2793 阅读 · 1 评论 -
Oracle用户组错误导致的错误
看了已经有很多的朋友开始关注11gR2了,并且也开始着手11gR2的cluster了,今天又碰到一个朋友,在安装11gR2中的错误。这个朋友部署的是standalone的grid infrastructure,既然是用grid infrastructure了,当然asm就是数据库的存储的首选了。grid infrastructure安装成功,状态如下[grid@rac11g1 ~]$ crs_stat -tName Type Target State H原创 2010-06-10 00:57:00 · 1818 阅读 · 0 评论 -
11gR2里的用户组
上篇文章"Oracle用户组错误导致的错误" 谈到了11gR2里的用户组权限导致的一个错误,这篇文章,就顺便把11gR2里的用户组总结一下了11gR2里的用户组:描述OS 组名分配给该组的 OS 用户Oracle 权限Oracle 组名Oracle 清单和软件所有者oinstallgrid、oracle Oracle 自动存储管理组asmadmingridSYSASMOSASMASM 数据库管理员组asmdbagrid、oracleASM 的 SYSDBAOSDBA for ASMASM 操作员组asmo原创 2010-06-10 01:08:00 · 1554 阅读 · 0 评论 -
addNode的错误NullPointException
No pre-requisite checks found in oraparam.ini, no system pre-requisite checks will be executed.Oracle Universal Installer, Version 10.2.0.1.0 ProductionCopyright (C) 1999, 2005, Oracle. All rights reserved.Exception java.lang.NullPointerException occ原创 2010-06-20 10:43:00 · 1968 阅读 · 0 评论 -
Oracle的监听定期down
在windows 2003 32bit下安装了oracle 10.2.0.4,配置两个实例,没做增量备份,只做系统计划任务进行exp备份,两个实例一个数据量小,一个数据量大,数据量大的应用于IBM Webshpere Portal,平时运行都没有问题,就是每15天左右监听就要down一次,监听日志里看到在执行service_update的时候报error-12571,在日志里发现13-8月 -2010 09:45:14 * ping * 0WARNING: Subscription原创 2010-08-19 08:37:00 · 1363 阅读 · 0 评论 -
Repair option of the ocrconfig command [ID 330234.1]
Repair option of the ocrconfig command [ID 330234.1]ocrconfig, crsApplies to: Oracle Server - Enterprise Edition - Version: 10.2.0.1 to 10.2.0.4 - Release: 10.2 to 10.2Information in this document applies to any platform.Goalocrconfig -repair is used to re原创 2010-12-24 21:20:00 · 2697 阅读 · 0 评论 -
rac静默安装的方法
rac静默安装的方法ghost, 环境, window, 用户所谓静默安装,就是microsoft的window提出的一个概念,以前安装window的时候,一步一步的安装,必须要相应式的完成,这对于要装多个机器来说特别的麻烦,就有了安装配置文件的想法,然后读这个文件进行安装,就不需要人守在面前了,当然后面ghost大行其道,有了其他的方法,这里给大家介绍rac的静默安装,当然这里的目的并不是静默,而是能够完全用命令行进行安装,而不需要xwindow的支持,这对一些特定的环境还是横有意义的。1.首先当然还是配原创 2010-12-24 21:21:00 · 2997 阅读 · 0 评论 -
跟 Inthirties学Oracle之checkpoint中的scn
<br />接上篇 《跟 Inthirties学Oracle之checkpoint由来》<br /> <br />上回说到了checkpoint的由来,checkpoint的出生意义不在于数据库本身的运行,其真正的价值体现在数据库的crash/instance recovery上。而且不是解决恢复的问题。恢复是比较容易搞定的,解决的是高效恰达好处的问题。做事不难,做到恰到好处就是个学问了,checkpoint就是这个学问。 题目中提到的scn就是我们这个文章的主角了。题目立的是“checkpoint中的原创 2010-06-03 14:26:00 · 1984 阅读 · 3 评论 -
Oracle数据块损坏恢复总结(转帖)
<br />查看数据坏块所在数据文件号及块号可以对表进行一次全表扫描,如:<br /> select count(*) from tablename;<br /> 1、没有备份的情况下:<br /> 1.1、使用exp/imp恢复<br /> 在这种情况下肯定会造成数据的丢失,在这种情况下应采取将数据导出然后重建表再进行导入的方法,来尽量恢复损坏数据块中的数据,但是在有坏块的情况下是不允许导出的,如下命令:<br /> Exp test/test file=t.dmp ta原创 2010-06-01 11:57:00 · 1785 阅读 · 0 评论 -
CRS-1006: No more members to consider 南辕北辙
http://inthirties.com:90/thread-1359-2-1.html这次的solaris有单实例迁移到RAC上不是很顺利。呵呵呵,放假了,小女儿在家里,家里热闹的多了。一下要你给她拿剪刀,一下要你给他画画,做手工,这样的也就是断断续续的。本已经结束了,在节点上也都注册好了database和instance。并且也已经试过了一次,整个rac都搞好了,原创 2010-04-06 09:22:00 · 8010 阅读 · 2 评论 -
ORA-15054: disk "%s" does not exist in diskgroup "%s"
http://inthirties.com:90/viewthread.jsp?tid=1365&page=1SQL> alter diskgroup dg1 drop disk /dev/rdsk/c4t4d0s5;alter diskgroup dg1 drop disk /dev/rdsk/c4t4d0s5*ERROR at line原创 2010-04-06 09:24:00 · 1627 阅读 · 0 评论 -
又见RAC宕机
http://inthirties.com:90/viewthread.jsp?tid=1375给csdn学习的朋友准备了一个solaris的Oracle环境,以便学习。http://topic.youkuaiyun.com/u/20100330/15/b2620935-630d-4bbf-8ccb-ad9a2dcc2bab.html?53665昨天将环境升级为RAC的原创 2010-04-06 09:12:00 · 812 阅读 · 0 评论 -
[14] >TRACE: clssnmPollingThread: node %1 (%2) missed(%3) checkin(s)
http://inthirties.com:90/viewthread.jsp?tid=1371&page=110.2.0.1上的rac有见到一些诡异日志[ CSSD]2010-04-03 19:20:35.970 [13] >TRACE: clssnmPollingThread: node solaris (1) missed(2) checkin(s)原创 2010-04-06 09:19:00 · 1252 阅读 · 0 评论 -
ORA-15053: diskgroup “%s” contains existing files
http://inthirties.com:90/thread-1364-2-1.htmlSQL> drop diskgroup dg1;drop diskgroup dg1*ERROR at line 1:ORA-15039: diskgroup not droppedORA-15053: diskgroup “DG1″ contain原创 2010-04-06 09:23:00 · 1950 阅读 · 0 评论 -
Important Log Locations for Grid Infrastructure
Clusterware daemon logs are all under /log/. Structure under /log/:alert.log - look here first for most clusterware issues./admin:./agent:./agent/crsd:./agent/crsd/oraagent_原创 2010-05-26 10:49:00 · 943 阅读 · 0 评论 -
11gR2 Clusterware Startup Sequence
Clusterware Startup SequenceThe following is the Clusterware startup sequence (image from the "Oracle Clusterware Administration and Deployment Guide):Dont let this picture scare原创 2010-05-26 09:49:00 · 1457 阅读 · 0 评论 -
11gR2 cluvfy tools usage
Note that the following only shows the available olsnodes syntax. For additional explanation on what these commands do, see the Oracle Documentation. Component Options:$ ./cluv原创 2010-05-26 11:51:00 · 1029 阅读 · 0 评论