OceanBase 集群高可用部署方案简介

转载已于 2024-06-12 09:35:58 修改 · 1.6k 阅读

4 ·

CC 4.0 BY-SA版权

原文链接：https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000000639609

文章标签：

#oceanbase #数据库

于 2024-05-19 15:55:06 首次发布

数据库中间件专栏收录该内容

16 篇文章

订阅专栏

OceanBase 数据库采用基于无共享（Shared-Nothing）的多副本架构，让整个系统没有任何单点故障，保证系统的持续可用。OceanBase 支持单机（单机房部署 OceanBase 集群）、机房（同城多机房部署 OceanBase 集群。机房以下统称：IDC）、城市（多城市部署 OceanBase 集群）级别的高可用和容灾，可以进行单机房、双机房、两地三中心、三地五中心部署，且支持部署仲裁服务来降低成本。

部署方案

方案一：同城三机房三副本部署

特点：

同城 3 个机房组成一个集群（每个机房是一个 Zone），机房间网络延迟一般在 0.5 ~ 2 ms 之间。
机房级灾难时，剩余的两份副本依然是多数派，依然可以同步 RedoLog 日志，保证 RPO=0。
无法应对城市级的灾难。

部署方案示图：

方案二：三地五中心五副本部署

特点：

三个城市，组成一个 5 副本的集群。
任何一个 IDC 或者城市的故障，依然构成多数派，可以确保 RPO=0。
由于 3 份以上副本才能构成多数派，但每个城市最多只有 2 份副本，为降低时延，城市 1 和城市 2 应该离得较近，以降低同步 RedoLog 的时延。

部署方案示图：

方案三：同城两机房 "主-备" 部署

特点：

每个机房都部署一个 OceanBase 集群，一个为主库一个为备库；每个集群有自己单独的 Paxos group，多副本一致性。
"集群间" 通过 RedoLog 做数据同步，形式上类似传统数据库 "主从复制" 模式，从主库 "异步同步" 到备库，类似 Oracle Data Guard 中的 "最大性能" 模式。

部署方案示图：

方案四：两地三中心 "主-备" 部署

特点：

主城市与备城市组成一个 5 副本的集群。任何主城市 IDC 的故障，最多损失 2 份副本，剩余的 3 份副本依然满足多数派。
备用城市建设一个独立的 3 副本集群，做为一个备库，从主库 "异步同步" 到备库。
一旦主城市遭遇灾难，备城市可以接管业务。

部署方案示图：

方案五：同城三机房仲裁服务部署

特点：

同城 3 个机房组成一个集群，机房间网络延迟一般在 0.5 ~ 2 ms 之间，其中两个机房放置全功能副本，分别作为一个 Zone，为了降低成本，第三机房部署仲裁服务（无需同步日志）。
机房级灾难时，剩余两个机房的副本可以选主、执行仲裁降级（全功能副本所在机房故障时），继续同步 RedoLog 日志，保证 RPO=0。
无法应对城市级的灾难。

部署方案示图：

方案六：三地五机房仲裁服务部署

特点：

三个城市，五个机房，城市 1 和城市 2 距离较近，部署全功能副本，城市 3 部署仲裁服务以降低成本（无需同步日志）。
任何一个 IDC 故障，剩余全功能副本依然满足多数派（3/4），可以确保 RPO=0。
任意两个 IDC 或者城市级故障，如果故障的都是全功能副本所属机房，剩余两个全功能副本不足多数派（2/4），可通过仲裁降级方式恢复服务（将故障的两个副本降级为 Learner），并确保 RPO=0。
由于 3 份以上副本才能构成多数派，但每个城市最多只有 2 份副本，为降低时延，城市 1 和城市 2 应该离得较近，以降低同步 RedoLog 的时延。

部署方案示图：

方案七：两地三机房仲裁服务部署

特点：

主城市有两个机房，分别包含两个 Zone，用于部署全功能副本。
备城市一个机房，部署仲裁服务，可降低部署成本以及跨城带宽开销。
主城市任意一个 IDC 故障，至多损失 2 份副本，此时可能不足多数派（2/4），可通过仲裁服务触发降级恢复，可以确保 RPO=0。
无法应对主城市灾难，备城市灾难无影响。

部署方案示图：

容灾方案

为满足不同客户和业务场景多样的容灾需求，OceanBase 数据库提供了多种高可用解决方案：

基于 Paxos 一致性协议的多副本高可用解决方案

该方案基于Paxos一致性协议实现，通常在同一个集群内通过多副本（例如，三副本或五副本）提供容灾能力。

在少数派副本不可用（三副本集群允许一个副本不可用，五副本集群允许两个副本不可用）时，数据库可以自动执行容灾切换并恢复服务，保证不丢数据（RPO = 0），故障恢复时间在 8 秒以内（RTO < 8s）。
基于日志异步复制的物理备库解决方案

该方案类似于传统数据库的主备复制解决方案。两个或多个集群之间，允许以租户为粒度，通过异步复制 Redo 日志来构建租户级别的主备关系，提供计划内无损切换和故障时有损切换两种容灾能力。

该方案主要用于满足双机房或双地域场景下的容灾需求。主租户提供读写能力，备租户提供只读和容灾能力。在执行计划内无损切换时，主租户和备租户互换角色，不丢数据（RPO = 0），切换时间为秒级（RTO 为秒级）。

当主租户所在的集群出现故障后，可以执行有损切换，将备租户切换为主租户。此时不能保证不丢数据，RPO 大于 0，切换时间为秒级（RTO 为秒级）。
基于仲裁的高可用解决方案

该方案是 OceanBase V4.1.0 版本新提供的一种高可用解决方案。该方案通过引入一个独立的仲裁服务，允许通过更少副本数提供良好的容灾能力。

这里以两个全功能副本和一个仲裁服务的部署架构为例：在一个全功能副本出现故障时，集群会在仲裁服务参与的情况下，自动执行容灾降级，保证数据不丢（RPO = 0），切换时间为秒级（RTO 为秒级）；在故障节点服务恢复后，集群会自动探测并执行服务升级，恢复故障前的可用能力。在此过程中，仲裁服务仅参与同步和持久化少量的元信息，资源开销（CPU/内存/网络等）极小。

上述三种高可用解决方案可以组合使用。OceanBase 数据库推荐如下多种部署模式，用户可根据对机房配置以及性能和可用性的需求进行灵活选择。

部署方案	容灾能力	RTO	RPO
同机房三副本	（少数派副本故障时）机器级无损容灾/机架级无损容灾	8s 内	0
同城双机房物理备库	（主机房故障时）机房级有损容灾	秒级	大于 0
同城三机房三副本	（少数派副本故障时）机房级无损容灾	8s 内	0
两地两中心物理备库	（地域故障时）有损容灾	秒级	大于 0
两地三中心加物理备库	（机房故障时）无损容灾/（地域故障时）有损容灾	秒级	机房故障时，RPO = 0；地域故障时，RPO 大于 0
三地三中心五副本	（地域故障时）无损容灾	8s 内	0
三地五中心五副本	（地域故障时）无损容灾	8s 内	0