AWR报告目前已经成为Oracle DBA分析问题,定位故障最为重要的报告,阅读与分析AWR报告的技能也是Oracle DBA必备的技能。国产数据库为了提高运维便捷性,都在做类似Oracle AWR报告的模仿,只不过由于指标体系不够完善,因此其“AWR报告”大多数只是一个摆设,除了TOP SQL功能外,并不能给运维带来更大的帮助。
GaussDB的可观测性指标做得相当不错,指标内容很丰富,指标的指向性也相当不错,而要做好“AWR报告”的基础就是这些准确而丰富的指标。基于这一点,我对GaussDB WDR报告的期待还是有点高的。下面我带着大家来浏览一下GaussDB的WDR报告,看看这个报告能否满足DBA日常运维分析数据库性能与故障的需要。
GaussDB的WDR报告全称是工作负载诊断报告,不过在TPOPS里被称为“性能报告”,我觉得“性能报告”不够严谨,不过如果用“工作负载诊断报告”又有点不够高大上。根据GaussDB分布式数据库的特点,这个报告分为三种类别:集群、CN节点和DN节点。这三种类型的工作负载放在一起又比较乱,分为三种格式是比较合适的,这方面GaussDB的设计还是比较符合DBA的习惯的,不过我也在思考分布式数据库的“AWR报告”是不是像PolarDB一样做成单文件多页的更加易读。不过对于GaussDB这样的可能会有很多个节点的分布式数据库,如果整个集群生成一份报告,也有一些副作用,一份报告生成的时间可能会比较长,而且有时候我们并不需要整个集群所有节点的报告。
今天因为时间关系,我先以集群报告为主线给大家介绍一下WDR都包含了哪些内容。因为报告的内容比较多,因此我们将略去一些平时不大关注的内容。