基本功能
GaussDB运维管理平台的基本功能:
- 用户管理
- 用户组管理
- 角色管理
- 活跃会话管理
- 后台功能(鉴权、校验弱口令)
GaussDB运维管理平台的实例管理功能:
- 实例纳管和解除纳管
- 实例启停
- 实例卸载
- 实例节点扩容
- 实例升级
- 实例容灾管理
- 实例告警管理
- 实例巡检
节点扩容
GaussDB运维管理平台支持对纳管的分布式数据库实例进行节点扩容。
在线扩容分为集群加节点和数据重分布两个阶段。除元数据切换外,均支持在线业务。
- 集群加节点阶段:完成新的CN或DN节点的安装、元信息同步、节点启动等操作。时长分钟级。
- 数据重分布阶段又可以继续划分为数据扩容重分布和表切换两个阶段。
- 数据扩容重分布:完成基线数据搬迁、增量数据搬迁(在线业务)。时长和集群的数据量相关,一般为小时级。
- 表切换:完成元数据切换。时长为秒级,会阻塞所有操作。
节点扩容的注意事项:
- 目前仅分布式部署模式支持节点扩容,主备版部署模式不支持扩容。
- 扩容是指分片扩容,仅支持扩容CN节点和DN节点,不支持其他组件扩容。
- 扩容以节点为单位,扩容节点的组件分布形态与扩容前实例分布规律相同。
- 实例扩容过程中有锁表,可能会阻塞业务,尽量在业务低峰期进行。
- 扩容前需要满足所有DN节点剩余的可用空间大于DN节点的最大单表空间。
- 存在故障节点的实例不允许扩容。
实例升级
GaussDB升级过程中涉及系统表和表数据的变更、进程重启,有版本兼容和业务中断的风险。
主要的几种升级方式对比如下:
升级方式 | 升级描述 | 业务中短时间 | 升级风险 | 用途 |
---|---|---|---|---|
原地升级 | 物理文件备份后,先做二进制升级,再做系统表更新适配 | 一般30分钟 | 低风险 | 新功能上线或解决产品Bug |
灰度升级 | 在线SQL更新系统表差异,再做二进制重启升级 | 10秒 | 中风险 | 新功能上线或解决产品Bug |
滚动升级 | 独立部署:按照DN分片数进行滚动升级。 混合部署/集中式:按照AZ区进行滚动升级 | DN主或CN进程切换10秒业务中断 | 低风险 | 新功能上线或解决产品Bug |
热补丁升级 | 内存加载Patch,函数替换 | 无业务中断 | 低风险 | 仅用于修复产品Bug |
GaussDB大小版本升级支持的升级方式如下:
区别 | 支持的升级方式 | |
---|---|---|
小版本升级 | 升级后不需要全量备份,内核guc参数模板无变更 | 原地升级、灰度升级、滚动升级、热补丁升级 |
大版本升级 | 升级后需要全量备份,内核guc参数模板有变更 | 原地升级、灰度升级、滚动升级 |
灰度升级也分为两种方式:
- 升级自动提交方式:所有节点一起升级,在升级过程中有大概10秒的业务中短时间。
- 升级待观察后提交方式:将数据库升级过程分为升级待观察、升级提交两个阶段。
- 升级待观察阶段:升级待观察阶段可以按照AZ升级,也可对升级的AZ进行回退,所有AZ升级完成后可以对实例进行业务测试。
- 升级提交阶段:提交当前的升级,提交后不可回退。
容灾管理
GaussDB运维管理平台支持的容灾管理功能:
- 容灾搭建:主数据库实例配置灾备数据库实例信息,等灾备数据库连接后进行全量复制。灾备数据库实例完成全量同步后,将与主数据库实例建立流式复制,进行日志的增量同步。
- 容灾状态查看:在容灾管理界面可以查看已经搭建的容灾关系组基本信息(包括RTO、RPO、日志差距、日志落盘速率等),并进行容灾倒换、灾备升主、容灾解除等操作。
- 容灾倒换:将容灾关系组中的主备实例角色互换,原来的主实例变为备实例,原来的备实例变为主实例。
- 灾备升主:将容灾关系组中的备实例提升为一个单独的主实例,原有的容灾关系组失效,原来的主实例会宕机。
- 容灾解除:主实例清除维护的对端容灾信息。容灾解除后,主实例可以重新建立新的容灾关系。
告警管理
GaussDB运维管理平台支持的监控告警管理功能有:
- 告警统计:包含实时告警和历史告警信息的统计,涵盖告警类型、告警时间、告警级别、告警持续时间、告警IP、告警描述、告警数据分析等。
- 告警模板管理:包括默认文本模板和默认JSON模板。
- 监控大盘:包括平铺展示、横向对比多个实例基本指标信息的列表看板,以及展示单个实例全方位详细监控指标的趋势看板。