本文主要介绍Oracle 10G的内置工具:自动工作负载信息库AWR(Automatic Workload Repository)。Oracle建议使用AWR来代替之前的Statspack
一.如何生成AWR报告
SQL> @/dba/app/oracle/product/10.2.0.4/db_1/rdbms/admin/awrrpt.sql
Enter value for report_type: --输入报表类型,支持txt和html,默认为html
Enter value for num_days: 1 --查看当天的snap id。默认保留7天,可修改
Enter value for begin_snap: 8807 --输入开始的snap id
Enter value for end_snap: 8816 --输入结束的snap id
Enter value for report_name: --输入报表名,不输入则使用默认名
二.AWR简介
AWR是一个Oracle的内置工具,DBA可以使用AWR采集性能相关的统计数据,并导出性能量度以跟踪潜在的问题。AWR一次采集的统计数据称之为快照,是由MMON(10G引入)的后台进程以及其从进程自动的每小时采集一次。为了节省空间采集的数据在7天后自动清除。快照频率和保留时间都可以由用户修改。AWR报表默认以HTML格式输出,当然也可以使用TXT格式输出。
AWR用于存储采集的性能统计数据的表都存储在SYSAUX表空间中的SYS模式下,并以WRM$_*和WRH$_*格式命名。WRM$_*格式的表用于存储元数据,其中M代表(metadata)。WRH$_*格式的表用于保存实际采集的统计数据,其中H代表(historical)。要使用AWR必须设置STATISTICS_LEVEL参数,该参数共有三个值:BASIC,TYPICAL,ALL。如果设置为BASIC将禁用许多特性,如ADDM(Automatic Database Diagnostic Monitor ADDM)自动数据库诊断监视器。Oracle 10G默认值为TYPICAL,AWR统计数据保留7天,每小时获取一次快照。
三.ASH(v$active_session_history)与AWR
10G之前用户连接产生的当前会话信息保存在v$session中,处于等待状态的会话同时被记录到v$session_wait中,当该连接断开以后,v$session及v$session_wait中的记录将被删除。这种机制产生了一个问题,若是普通会话(指没有大量占用系统资源的会话)则对性能调整无足轻重,但是被删除的会话在活动时占用了大量的系统资源(CPU,内存,I/O等),该会话信息的丢失,将无法测评当时的系统瓶颈是什么。不过Oracle 10G出现了一个视图:v$session_wait_history。这个视图保存了每个活动session在v$session_wait中最近10次的等待事件(ASH缺省每一秒收集一次v$session中活动会话的情况,记录会话等待的事件,不活动的会话不会被采样,间隔时间由 _ash_sampling_interval 参数确定)。但这对于一段时期内的数据性能状况的监测是远远不够的,为了解决这个问题,在10g中还新添加了一个视图:v$active_session_history。这就是ASH(active session history)。典型的情况下,为了诊断当前数据库的状态,需要最近的五到十分钟的详细信息。然而,由于记录session的活动信息是很费时间和空间的,ASH采用的策略是:保存处于等待状态的活动session的信息,每秒从v$session_wait中采样一次,并将采样信息保存在内存中(ASH的采样数据是保存在内存中)。
ASH的采样数据是保存在内存中。而分配给ASH的内存空间是有限的,当所分配空间占满后,旧的记录就会被覆盖掉;而且数据库重启后,所有的这些ASH信息都会消失。这样,对于长期检测oracle的性能是不可能的。在Oracle10g中,提供了永久保留ASH信息的方法,这就是AWR(Automatic Workload Repository)。
由于全部保存ASH中的信息是非常耗费时间和空间的,AWR采用的策略是:MMON进程每小时对ASH (v$active_session_history)进行采样一次,并将信息保存到磁盘中,当ASH BUFFER满的话MMNL进程会写,并保留7天,7天后旧的记录才会被覆盖。这些采样信息被保存在表wrh$_active_session_history中。而这个采样频率(1小时)和保留时间(7天)是可以根据实际情况进行调整的,这就给DBA们提供了更加有效的系统监测工具。AWR永久地保存系统的性能诊断信息,由SYS用户拥有。一段时间后,你可能想清除掉这些信息;有时候为了性能诊断,你可能需要自己定义采样频率来获取系统快照信息。Oracle 10g在包dbms_workload_repository中提供了很多过程,通过这些过程,你可以管理快照并设定基线(baselines:用于保存指定时间段的历史数据用于将来分析及对比)。
ASH保存了系统最新的处于等待的会话记录,可以用来诊断数据库的当前状态;而AWR中的信息最长可能有1小时的延迟,所以其采样信息并不能用于诊断数据库的当前状态,但可以用来作为一段时期内数据库性能调整的参考。
四.详细介绍AWR
1.ASH的采集信息保存在内存中,在旧的信息被采样到AWR中后,可被新采集的信息覆盖,重启oracle后该信息被清除。分配给ASH的内存大小可以查询到:
SQL> select pool,name,bytes/1024/1024 from v$sgastat where name like '%ASH %';
POOL NAME BYTES/1024/1024
------------ -------------------------- ---------------
shared pool ASH buffers 15.5
2.AWR记录的信息不仅是ASH,还可以收集到数据库运行的各方面统计信息和等待信息,用以诊断分析。AWR的采样方式是,以固定时间间隔为其所有重要的统计信息和负载信息执行一次采样并保存到AWR中。
3.mmon进程与mmnl进程,快照由一个称为MMON的新的后台进程(及其从进程)以及MMNL后台进程自动地每隔固定时间采样一次。MMON进程负责执行多种和管理相关(manageability-related)的后台任务,例如:当某个测量值(metrics)超过了预设的限定值(threshold value)后提交警告创建新的MMON隶属进程(MMON slave process)来进行快照(snapshot)捕获最近修改过的SQL对象的统计信息。MMNL进程负责执行轻量级的且频率较高的和可管理性相关的后台任务,例如捕获会话历史信息,测量值计算等。AWR的采样工作由MMON进程每个1小时执行一次,ASH信息同样会被采样写出到AWR负载库中。虽然ASH buffer被设计为保留1小时的信息,但很多时候这个内存是不够的,当ASH buffer写满后,另外一个后台进程MMNL将会主动将ASH信息写出。
4.SYSAUX表空间,这些采样数据都存储在SYSAUX表空间中,并且以WRM$_* 和 WRH$_*的格式命名。前一种类型存储元数据信息(如检查的数据库和采集的快照),后一种类型保存实际采集的统计数据。
SQL> select table_name from dba_tables where table_name like 'WRM$%';
TABLE_NAME
------------------------------
WRM$_WR_CONTROL
WRM$_SNAP_ERROR
WRM$_SNAPSHOT
WRM$_DATABASE_INSTANCE
WRM$_BASELINE
当SYSAUX表空间满后,AWR将自动覆盖掉旧的信息,并在警告日志中记录一条相关信息:
ORA-1688: unable to extend table SYS.WRH$_ACTIVE_SESSION_HISTORY partition WRH$_ACTIVE_3533490838_1522 by 128 in tablespace SYSAUX
5.采样频率和保留时间可以通过查询视图dba_hist_wr_control或(wrm$_wr_control)来查询AWR的采样频率和保留时间。默认为每1小时采样一次,采样信息保留时间为7天。
SQL> select * from dba_hist_wr_control;
SQL> select DBID,SNAP_INTERVAL,SNAPINT_NUM,RETENTION from wrm$_wr_control;
6.采样数据量由于数据量巨大,把所有ASH数据写到磁盘上是不能接受的。一般是在写到磁盘的时候过滤这个数据,写出的数据占采样数据的10%,写出时通过direct-path insert完成,尽量减少日志生成,从而最小化数据库性能的影响。
7.初始化参数statistics_level,AWR的行为受到参数STATISTICS_LEVEL的影响。这个参数有三个值:BASIC:awr统计的计算和衍生值关闭,只收集少量的数据库统计信息。TYPICAL:默认值,只有部分的统计收集,他们代表需要的典型监控oracle数据库的行为。ALL:所有可能的统计都被捕捉,并且有操作系统的一些信息,这个级别的捕捉应该在很少的情况下,比如你要更多的sql诊断信息的时候才使用。
五.使用AWR
AWR由Oracle自动产生,不过也可以通过DBMS_WORKLOAD_REPOSITORY包来手工创建,修改和删除。接下来介绍DBMS_WORKLOAD_REPOSITORY的使用:
1. 查看当前的AWR保存策略:
SQL> select * from dba_hist_wr_control;
DBID SNAP_INTERVAL RETENTION TOPNSQL
---------- -------------------- -------------------- ----------
3728795045 +00000 01:00:00.0 +00007 00:00:00.0 DEFAULT
2. 更改AWR采样频率和保存时间:
SQL> exec dbms_workload_repository.modify_snapshot_settings(interval=>30,retention=>5*24*60);
3. 关闭AWR,把interval设置为0则关闭自动采样快照:
SQL> exec dbms_workload_repository.modify_snapshot_settings(interval=>0);
4. 手工创建一个快照
exec dbms_workload_repository.create_snapshot();
5. 查看快照
SQL> select * from sys.wrh$_active_session_history;
6. 手工删除指定范围的快照
exec dbms_workload_repository.drop_snapshot_range(low_snap_id=>8867,high_snap_id=>8868,dbid=>3728795045);
7. 创建baseline
SQL> exec dbms_workload_repository.create_baseline(8800,8866,'base_line_huang');
8. 查询当前的baseline
SQL> select * from dba_hist_baseline;
9. 删除baseline
SQL> exec dbms_workload_repository.drop_baseline('base_line_huang');