一套达梦DM8的数据库突然宕机了,从达梦数据库的日志中没有发现任何有价值的报错信息:
13点13分的最后一个报错信息是一个网络报错,因为有会话断开导致,只是一个警告,并不是导致达梦数据库宕机的主要原因。在操作系统上也找不到core dump的信息:
如何进一步定位问题呢?这时候D-SMART登场了。从告警台可以看出11:00开始系统开始出现大量的runtime error报警,并且在13点开始超过了20个:
大致定位系统故障的开始区间是在13点左右。从runtime error指标上看:
从今天上午11点多开始增多,到下午11:42达到峰值,在13:14分后,数据库宕机。于是我们从11:11到13:15之间生成一份数据库的诊断报告&