Stolon项目架构解析：高可用PostgreSQL集群的核心设计-优快云博客

Stolon项目架构解析：高可用PostgreSQL集群的核心设计

stolon sorintlab/stolon: 是一个用于管理 PostgreSQL 数据库的高可用性、分布式数据库集群工具。适合用于构建高可用性、分布式的 PostgreSQL 数据库集群，特别是对于需要高可用性和分布式的数据库场景。特点是高可用性、分布式、支持 PostgreSQL 数据库。项目地址: https://gitcode.com/gh_mirrors/st/stolon

一、Stolon项目概述

Stolon是一个为PostgreSQL提供高可用性解决方案的开源项目，它通过独特的架构设计确保了数据库服务的持续可用性。本文将深入剖析Stolon的核心组件和工作原理，帮助读者全面理解这一PostgreSQL高可用解决方案的设计哲学。

二、核心组件架构

Stolon采用模块化设计，主要由三个关键组件构成：

1. Keeper（守护者）

Keeper是Stolon架构中最基础的组件，每个Keeper负责管理一个PostgreSQL实例。它的主要职责包括：

监控PostgreSQL实例的健康状态
根据Sentinel提供的集群视图(clusterview)调整PostgreSQL实例的角色
执行主从切换、数据同步等操作
确保数据一致性

关键特性：

每个Keeper必须拥有唯一的UID标识
需要持久化的数据存储目录
支持手动指定或自动生成UID

2. Sentinel（哨兵）

Sentinel是Stolon集群的大脑，负责集群状态决策：

持续发现和监控所有Keeper的状态
计算最优的集群拓扑结构
决定主从切换时机
生成集群视图(clusterview)并同步给其他组件

工作特点：

采用领导者选举机制确保决策一致性
无状态设计，依赖外部存储
自动处理网络分区等异常情况

3. Proxy（代理）

Proxy是客户端访问数据库的入口，提供智能路由功能：

自动将客户端连接路由到当前主库
强制关闭到旧主库的连接
实现透明的故障转移

重要特性：

无状态设计，可水平扩展
自动感知集群拓扑变化
在网络分区时保护数据一致性

三、存储后端设计

Stolon依赖分布式键值存储来维护集群状态，支持多种存储后端：

1. etcd/Consul后端

利用Raft协议保证数据一致性
需要配置高可用集群(至少3节点)
etcd v3需定期压缩以避免存储空间耗尽
支持自定义存储路径前缀

2. Kubernetes后端

直接使用Kubernetes API Server作为存储
依赖ConfigMap存储集群数据
通过Pod标签实现组件发现
需要注意API Server的性能影响

存储分区处理：当组件无法与存储后端通信时，Stolon会持续重试。Proxy在这种情况下的保守策略是关闭所有连接，以避免将流量导向可能已失效的主库。

四、关键配置要求

1. PostgreSQL用户配置

Stolon需要两类特殊用户：

超级用户(Superuser)：

用于管理PostgreSQL实例
执行pg_rewind操作(如启用)
通过--pg-su-username和--pg-su-password参数配置

复制用户(Replication User)：

用于主从数据同步
通过--pg-repl-username和--pg-repl-password参数配置

安全建议：

生产环境避免使用trust认证
确保所有Keeper使用相同的用户凭证
限制超级用户的直接访问

2. 连接数管理

需要注意PostgreSQL的max_connections设置：

连接数耗尽会影响复制连接
超级用户连接受superuser_reserved_connections保护
建议合理设置连接数或限制超级用户连接

五、灾备与恢复

存储永久丢失处理

当存储后端永久丢失时：

不要从备份恢复Stolon相关数据
使用existing初始化模式重建集群
避免旧集群状态与新状态冲突

持久化要求

Keeper必须使用持久化存储卷
避免所有Keeper同时停止
不要重用Keeper UID但更换数据目录

六、架构设计理念

Stolon的架构体现了几个核心设计原则：

职责分离：各组件分工明确，降低耦合度
无状态设计：除Keeper外，其他组件无状态，便于扩展
保守决策：在网络不确定时优先保护数据一致性
自动化：全自动的故障检测与恢复机制
云原生：深度集成Kubernetes等现代基础设施

通过这种架构，Stolon能够在各种故障场景下保持PostgreSQL服务的高可用性，同时确保数据的安全性和一致性。理解这些设计原理，有助于在实际部署中做出合理的配置决策和故障排查。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考