Oracle数据库运维方案及优化
运维优化
本文详细讲解了如何对Oracle数据库进行运维,从各个方面来说明了如何去运维。
文章目录
前言:
在上一篇文章中我们讲了关于Oracle数据库的性能方面的优化,这篇文章咱们讲讲关于运维方面的优化吧。
上一篇文章的地址:
Oracle数据库性能优化
一 为啥要运维,运维哪些内容?
数据库的运维主要结合 目标系统的实际情况,提供切实可行的运维建设机制, 内容覆盖 ORACLE 数据库的日常维护、紧急故障处理,软件升级等,客户可依据 服务内容进行相应的定制。我们将会提供全面的、针对性的服务解决方案,以保 证客户系统稳定、高效、可靠的运行,以达到对业务系统的有效支持。
二 检查数据库基本状况
对数据库的基本状况进行检查,其中包含:
- 检查 Oracle 实例状态
- 检查 Oracle 服务进程
- 检查 Oracle 监听进程
2.1 检查Oracle实例状态
SQL> select instance_name,host_name,startup_time,status,database_status from v$instance;
其 中 “STATUS” 表 示 Oracle 当 前 的 实 例 状 态 , 必 须 为 “OPEN” ; “DATABASE_STATUS”表示 Oracle 当前数据库的状态,必须为“ACTIVE”。
select name,log_mode,open_mode from v$database;
其中“LOG_MODE”表示 Oracle 当前的归档方式。“ARCHIVELOG”表示数据 库运行在归档模式下,“NOARCHIVELOG”表示数据库运行在非归档模式下。
2.2 检查Oracle服务进程
$ ps -ef|grep ora_|grep -v grep&&ps -ef|grep ora_|grep-v grep|wc –l
在检查 Oracle 的进程命令输出后,输出显示至少应包括以下一些进程:
- Oracle 写数据文件的进程,输出显示为:“ora_dbw0_CKDB”
- Oracle 写日志文件的进程,输出显示为:“ora_lgwr_ CKDB”
- Oracle 监听实例状态的进程,输出显示为:“ora_smon_CKDB”
- Oracle 监听客户端连接进程状态的进程,输出显示为:“ora_pmon_CKDB”
- Oracle 进行归档的进程,输出显示为:“ora_arc0_ CKDB”
- Oracle 进行检查点的进程,输出显示为:“ora_ckpt_ CKDB”
- Oracle 进行恢复的进程,输出显示为:“ora_reco_ CKDB”
2.3 检查Oracle监听状态
/home/oracle>lsnrctl status
“Services Summary”项表示 Oracle 的监听进程正在监听哪些数据库实例, 输出显示中至少应该有“CKDB”这一项。
检查监听进程是否存在:
[oracle@AS14 ~]$ ps -ef|grep lsn|grep -v grep
三 检查系统和oracle日志文件
检查相关的日志文件,包含:检查操作系统的日志文件,检查 Oracle 日志 文件,检查 Oracle 核心转储目录,检查 Root 用户和 Oracle 用户的 email,总 共四个部分。
3.1 检查操作系统日志文件
cat /var/log/messages |grep failed
查看是否有与 Oracle 用户相关的出错信息。
3.2 检查oracle日志文件
[oracle@AS14 ~]$ cat /data/oracle/admin/CKDB/bdump/alert_CKDB.log |grep ora- [oracle@AS14 ~]$ cat /data/oracle/admin/CKDB/bdump/alert_CKDB.log |grep err [oracle@AS14 ~]$ cat /data/oracle/admin/CKDB/bdump/alert_CKDB.log |grep fail
Oracle 在运行过程中,会在警告日志文件(alert_SID.log)中记录数据库的 一些运行情况:数据库的启动、关闭,启动时的非缺省参数;数据库的重做日志 切换情况,记录每次切换的时间,及如果因为检查点(checkpoint)操作没有执行 完成造成不能切换,会记录不能切换的原因;对数据库进行的某些操作,如创建 或删除表空间、增加数据文件;数据库发生的错误,如表空间不够、出现坏块、 数据库内部错误(ORA-600)等。定期检查日志文件,根据日志中发现的问题及时 进行处理:
问题 | 处理 |
---|---|
启动参数不对 | 检查初始化参数文件 |
因为检查点操作或归档操作没有完成造成重做日志不能切换 | 如果经常发生样的情况,可以考虑增加重做日志文件组;想办法提高检查点或归档操作的效率; |
有人未经授权删除了表空间 | 检查数据库的安全问题,是否密码太简单;如有必要,撤消某些用户的系统权限 |
出现坏块 | 检查是否是硬件问题(如磁盘本生有坏块),如果不是,检查是那个数据库对象出现了坏块,对这个 对象进行重建 |
表空间不够 | 增加数据文件到相应的表空间出现 |
ORA-600 | 根据日志文件的内容查看相应的 TRC 文件,如果是 Oracle 的 bug,要及时打上相应的补丁 |
3.3 检查Oracle核心转储目录
$ls $ORACLE_BASE/admin/CKDB/cdump/*.trc|wc -l
$ls $ORACLE_BASE/admin/CKDB/udump/*.trc|wc –l
如果上面命令的结果每天都在增长,则说明 Oracle 进程经常发生核心转储。 这说明某些用户进程或者数据库后台进程由于无法处理的原因而异常退出。频繁 的核心转储特别是数据库后台进程的核心转储会导致数据库异常终止。
3.4 检查Root用户和Oracle用户的email
tail –n 200 /var/mail/root
tail –n 200 /var/mail/oracle
查看有无与 Oracle 用户相关的出错信息。
四 检查Oracle对象状态
检查相关 Oracle 对象的状态,包含:检查 Oracle 控制文件状态,检查 Oracle 在线日志状态,检查 Oracle 表空间的状态,检查 Oracle 所有数据文件状态,检 查 Oracle 所有表、索引、存储过程、触发器、包等对象的状态,检查 Oracle 所 有回滚段的状态,总共六个部分。
4.1 检查Oracle控制文件状态
select status