OceanBase 数据库是原生的分布式数据库,故障原因涉及的因素比较多,如配置参数、运行负载及服务器环境等,对于 DBA 来说故障根因分析是个比较大的挑战。obdiag 是 OceanBase 官方推出的一款黑屏诊断工具,包含收集数据库日志、SQL Audit 以及进程堆栈等信息的功能,支持多种集群部署模式下的一键执行,完成诊断信息的获取。今天我们就一起了解下这个工具的具体功能和特点。
一键信息收集
分布式数据库节点数量比较多,问题分析时需要登录到不同的服务器收集相关信息,操作非常繁琐效率也很低。obdiag 提供 obdiag gather log 一键日志收集功能,大大简化了信息收集过程,为故障处理争取了更多的时间。
通过设定相应的参数,obdiag 支持收集指定时间段和包含相关关键字的信息,并且还可以编写脱敏规则来定义敏感数据,收集的数据会自动根据规则来进行脱敏处理(非常贴心的功能,给 OB 开发人员点赞!)。
一键集群巡检
集群巡检功能中内置了一系列巡检指标,从系统内核参数、集群状态、系统资源、系统状态及错误代码等多个维度评估系统运行状态是否健康,发现已存在或可能会导致集群出现异常问题的原因分析并给出相应的处理建议。
除了内置的指标外,还支持编写 yaml 脚本,通过 task 调用,来实现更为专业的、更加个性化的巡检工作。
一键诊断分析
一键诊断分析通过 obdiag analyze 命令帮助管理员做相关的诊断信息分析,支持全链路诊断日志一键分析、参数对比分析、变量分析、索引空间分析、内存分析和对列积压分析等多个子模块。
- 日志分析诊断使用 obdiag analyze log 对日志进行分析,找出发生过的错误信息,既支持直接连接集群节点的在线分析,也支持通过 --files 指定离线文件开启离线分析模式。全链路诊断日志分析能够对全链路日志进行分析,给出全链路诊断报告。

最低0.47元/天 解锁文章
934

被折叠的 条评论
为什么被折叠?



