PostgreSQL集群篇——2、PG环境安装准备

PostgreSQL集群篇——2、PG环境安装准备

作者

CN華少

标签

PostgreSQL,PG,集群,DBA,架构师,PG安装,编译安装

背景QQQ

PostgreSQL官方文档中讲到了多种高可用、负载均衡和复制特性解决方案,如下图所示:

特性共享磁盘故障转移文件系统复制预写式日志传送逻辑复制基于触发器的主-备复制基于语句的复制中间件异步多主控机复制同步多主控机复制
最通用的实现NASDRBD内建流复制内建逻辑复制,pglogicalLondiste,Slonypgpool-IIBucardo
通信方法共享磁盘磁盘块WAL逻辑解码表行SQL表行表行和行锁
不要求特殊硬件
允许多个主控机服务器
无主服务器负载
不等待多个服务器with sync offwith sync off
主控机失效将永不丢失数据with sync onwith sync on
复制体接受只读查询with hot
每个表粒度
不需要冲突解决

我们在集群环境中使用这些技术,首先需要考虑的是我们目前面临的是什么问题,例如我现在面临的就是高并发问题如何来解决,按照上述图表中我选择了流复制解决方案。

在流复制解决方案中分为同步、异步两种,异步流复制通常采用的是基于wal日志来传送的方式进行,从节点通常比主节点要少一个wal日志块的数据,这给我们并发查询造成了影响,因此这里我们需要采用同步流复制解决方案,其采用的是数据流的方式,就像小溪一样,水一直流淌着,多条分支最终汇总到一处,同时接收处也在一直存储着。

流复制是从2010年推出pg9.0版本以后开始的,其版本到目前经历的阶段如下:

版本方式描述
PostgreSQL9.0流式物理复制开始支持流式物理复制,用户可以通过流式复制构建只读备库
PostgreSQL9.1同步流复制开始支持同步复制,只支持一个同步流复制节点,同步流复制能保证数据的0丢失
PostgreSQL9.2级联流复制开始支持联流复制,备库下面还可以再连接备库,形成级联架构
PostgreSQL9.2流式虚拟备库开始支持虚拟备库,即备库中没有数据文件,只包含wal文件。
PostgreSQL9.4逻辑复制开始支持逻辑复制,逻辑复制可以应对部分表复制的功能。
PostgreSQL9.6同步流复制改版同步流复制允许多个备用服务器以提高可靠性。
PostgreSQL10使用发布/订阅进行逻辑复制
PostgreSQL11-13持续优化

本次我们将采用PostgreSQL13.1版本进行搭建同步流复制环境,数据库安装我们采用了编译安装,如不清楚怎样安装,请查看之前的文章《PostgreSQL集群篇——1、PG环境安装准备》

环境

PostgreSQL集群篇整体采用3台虚拟机进行搭建,相关情况如下:

服务器IP端口号CPU内存存储作用
10.28.1.18151004核8G200G主master节点,
10.28.1.18251004核8G200G从slave节点,

前期准备

1、修改内核参数

sudo vim /etc/sysctl.conf

kernel.shmmni = 4096
 kernel.sem = 250 32000 100 128
 fs.file-max = 65536      # 系统最大打开文件描述符数
 net.ipv4.ip_local_port_range = 1024 65000
 net.core.rmem_default = 1048576
 net.core.rmem_max = 1048576
 net.core.wmem_default = 262144
 net.core.wmem_max = 262144
sudo sysctl -p

master主节点内容:

1、在master与slave节点上面设置全局Host
sudo vim /etc/hosts

在内容顶部增加如下配置

10.28.1.181 master
10.28.1.182 slave
10.28.1.210 vip</pre>

2、对master节点的访问配置文件进行修改设置
su postgres
 cd /pg/data
 vim pg_hba.conf
在host all all 127.0.0.1/32 trust下面添加两行信息
# IPv4 local connections:
 host    all             all             127.0.0.1/32            trust
 # 放开全局访问,任何IP都可以使用md5加密的方式,使用任何账号访问任何数据库
 host    all             all             0.0.0.0/0               md5
 # 放开repuser用户,可以通过slave主机名(IP)通过md5的效验方式进行访问replication
 host    replication     repuser         slave                   md5
3、进入master数据库中,创建一个账号,用于我们同步过程中使用,这个账号可以自定义,这里我们使用repuser
postgres@pgserver:/pg$ psql -p5100 -h127.0.0.1
 psql (13.1)
 Type "help" for help.
 
 postgres=# CREATE USER repuser replication LOGIN CONNECTION LIMIT 3 ENCRYPTED PASSWORD 'repuser';
 CREATE ROLE
4、修改postgresql.conf文件使其具备主节点所需条件

当然你也可以采用如下方式进行简单配置,完成简单的复制设置。

vim postgresql.conf
 # - Connection Settings -
 listen_addresses = '*'
 port = 5100

注意:在PostgreSQL12及以上版本,我们如果要实现一个简单的复制设置仅需修改一下监听即可,其他均可使用默认设置,直接就具备主节点条件。

当然我们也可以采用另一种方式,在其postgresql.conf底部找到#include_dir = '...' 参数,更改为include_dir = 'conf.d' ,并在其配置文件所在目录下创建conf.d文件夹,使用本文中提供的配置文件上传至该目录中,则需要设置的复杂参数均完成替换,这里面包含了多个文件,对其8G环境下的优化后的配置参数,通常使用这套配置后的端口是5100,可根据自己需要进行修改。这里我们推荐按照上方步骤逐渐进行。本集群篇中整个完成后我们将获得到和配置仓库中提供的配置文件一样的配置。

5、重启master主节点
systemctl restart postgresql
# 或
pg_ctl restart
6、验证主节点是否已完成
postgres@pgserver:/pg$ psql -p5100 -h127.0.0.1
psql (13.1)
Type "help" for help.

postgres=# select pg_is_in_recovery();
 pg_is_in_recovery 
-------------------
 f
(1 row)

postgres=#

pg_is_in_recovery显示为f,代表着我们的主节点设置完毕了,下面我们开始进行从节点的设置。


我是一个明显的分割线


slaver从节点内容:

1、在slave节点中备份master的数据目录

注:在第一篇时,我们已经初始化了slave节点,这里我们需要先做一个删除$PGDATA目录的操作,让其重新根据master备份过来。

rm -rf $PGDATA

主要命令:

pg_basebackup -h master -p 5100 -U repuser -D $PGDATA -Fp -Xs -R -P -v

pg_basebackup被用于获得一个正在运行的PostgreSQL数据库集簇的基础备份。

-D directory

将输出写到哪个目录。如果必要,pg_basebackup将创建该目录及任何父目录。

-Fp

把输出写成平面文件,使用和当前数据目录和表空间相同的布局。

-X stream

在备份被创建时通过流复制传送预写式日志。这将开启一个到服务器的第二连接并且在运行备份时并行开始流传输预写式日志。

-R

--write-recovery-conf

在输出目录中(或者当使用 tar 格式时在基础归档文件中)建立 standby.signal 并附加连接设置到postgresql.auto.conf 来简化设置一个后备服务器。postgresql.auto.conf文件将记录连接设置(如果有)以及pg_basebackup所使用的复制槽,这样流复制后面就会使用相同的设置。

-P

--progress

启用进度报告。

-v

--verbose

启用冗长模式,可以理解为输出备份过程数据。

查看postgresql.auto.conf配置文件,检查是否包含了以下配置信息:

# Do not edit this file manually!
# It will be overwritten by the ALTER SYSTEM command.
primary_conninfo = 'user=repuser password=repuser channel_binding=disable host=master port=5100 sslmode=disable sslcompression=0 ssl_min_protocol_version=TLSv1.2 gssencmode=disable krbsrvname=postgres target_session_attrs=any'

如果不包含,则修改postgresql.conf文件中primary_conninfo参数。

注:任何在数据库中执行命令修改参数的操作,都将存储在postgresql.auto.conf配置文件文件中

2、修改本机的postgresql.conf文件中以下参数,这里可根据自己需求进行修改。
# - Connection Settings -

listen_addresses = '*'          # what IP address(es) to listen on;
                                        # comma-separated list of addresses;
                                        # defaults to 'localhost'; use '*' for all
                                        # (change requires restart)
port = 5100                             # (change requires restart)
max_connections = 2000                  # (change requires restart)

3、启动slave节点,并连接数据库测试

systemctl start postgresql
或
pg_ctl start

如果找不到pg_ctl,可以执行source /etc/profile让其在当前用户下生效系统环境变量。

postgres@pgserver:/pg/data$ psql -p5100 -h127.0.0.1
psql (13.1)
Type "help" for help.

postgres=# select pg_is_in_recovery();
 pg_is_in_recovery 
-------------------
 t
(1 row)

postgres=#

pg_is_in_recovery显示为t,表示其已经是从节点数据库了,这时我们去master节点中连接数据库并确认一下是否可见该节点。

postgres@pgserver:/pg$ source /etc/profile
postgres@pgserver:/pg$ psql -p5100 -h 127.0.0.1
psql (13.1)
Type "help" for help.

postgres=# select * from pg_stat_replication;
  pid  | usesysid | usename | application_name | client_addr | client_hostname | client_port |         back
end_start         | backend_xmin |   state   | sent_lsn  | write_lsn | flush_lsn | replay_lsn | write_lag |
 flush_lag | replay_lag | sync_priority | sync_state |          reply_time           
-------+----------+---------+------------------+-------------+-----------------+-------------+-------------
------------------+--------------+-----------+-----------+-----------+-----------+------------+-----------+
-----------+------------+---------------+------------+-------------------------------
 68980 |    16384 | repuser | walreceiver      | 10.28.1.182 | slave           |       52046 | 2021-01-25 0
9:53:57.757238+00 |              | streaming | 0/50009E0 | 0/50009E0 | 0/50009E0 | 0/50009E0  |           |
           |            |             0 | async      | 2021-01-26 03:13:15.806144+00
(1 row)

postgres=#

这里我们可以看到slave节点已经上线,并正常运行了。

至此我们搭建完成了主备流复制环境,可以开始我们下一步的学习了。

本文声明

88x31.png

知识共享许可协议 本作品由 cn華少 采用 知识共享署名-非商业性使用 4.0 国际许可协议 进行许可。

<think>嗯,用户需要PostgreSQL集群部署的教程或最佳实践,我需要结合站内引用给出清晰的步骤。用户明确引用了几个关键信息点:主从复制配置(引用1)、配置文件修改位置(引用2)、Patroni高可用方案示例(引用3)、PostgreSQL的核心优势(引用4)以及主节点重启和slave数据同步命令(引用5)。用户是数据库运维或开发人员,实际需求可能是搭建生产环境的高可用集群。深层需求可能包括:避免配置踩坑、确保故障切换可靠性、性能优化。引用3提到的Patroni方案值得重点展开,因为这是当前主流的生产级方案。先从基础知识切入,确保用户理解主从复制的必要性——引用4提到的高可用性和海量数据支撑能力。部署步骤分为传统手动方式和自动化工具两类:1.传统方式重点参考引用1和5的主从配置,强调postgresql.conf的wal_level/hot_standby等参数设置,以及pg_basebackup同步数据的命令细节2.自动化方案重点用引用3的Patroni示例,说明如何通过systemd管理集群状态需要提醒配置文件路径差异(引用2提到/usr/pgsql-*/bin目录结构),避免版本兼容问题。操作风险方面,引用5的rm-rf命令危险,必须加注"确保数据备份"的警告。最后主动延伸高可用测试方法(主节点故障模拟)和性能优化建议,覆盖用户可能的后续问题。</think> 以下是基于引用内容整理的PostgreSQL集群部署核心步骤及最佳实践,涵盖主从复制与高可用部署方案: ### 一、基础主从复制集群部署 #### 1. 主节点配置 ```bash # 修改postgresql.conf [^1][^2] wal_level = replica max_wal_senders = 10 hot_standby = on # 创建复制用户 CREATE USER rep REPLICATION LOGIN ENCRYPTED PASSWORD '密码'; ``` ```bash # 修改pg_hba.conf [^1] host replication rep slave_ip/32 md5 ``` ```bash # 重启主节点 [^5] sudo systemctl restart postgresql-14 ``` #### 2. 从节点配置 ```bash # 同步数据(在主节点操作)[^5] rm -rf /home/postgres/data/ # 注意:确保目录为空 pg_basebackup -h master_ip -p 5432 -U rep -Fp -Xs -Pv -R -D /home/postgres/data/ ``` ```bash # 自动生成standby.signal文件[^1] # 检查postgresql.auto.conf包含: primary_conninfo = 'host=master_ip port=5432 user=rep password=xxx' ``` ### 二、高可用方案(基于Patroni) #### 1. 核心组件部署 ```yaml # /etc/patroni.yml 示例 [^3] scope: pg_cluster name: node1 restapi: listen: 0.0.0.0:8008 etcd: hosts: [etcd_node1:2379, etcd_node2:2379] bootstrap: dcs: ttl: 30 retry_timeout: 10 postgresql: use_pg_rewind: true parameters: max_connections: 100 postgresql: listen: 0.0.0.0:5432 data_dir: /var/lib/pgsql/13/data ``` #### 2. 服务管理 ```bash # 启动Patroni集群 [^3] systemctl enable patroni systemctl start patroni # 查看节点状态 patronictl -c /etc/patroni.yml list ``` ### 三、最佳实践建议 1. **性能优化** ```bash # postgresql.conf 关键参数 [^4] shared_buffers = 25% RAM # 建议系统内存的25% maintenance_work_mem = 1GB # 大表维护时提升VACUUM效率 max_parallel_workers = 8 # 利用多核CPU处理查询 ``` 2. **高可用保障** - 使用**etcd/ZooKeeper**管理集群状态(引用3) - 配置**pg_rewind**支持节点重新加入(避免全量同步) - 启用**同步提交**保证数据一致性: ```sql ALTER SYSTEM SET synchronous_commit = remote_write; ``` 3. **灾难恢复** ```bash # 持续归档配置 wal_level = replica archive_mode = on archive_command = 'scp %p backup_server:/pg_wal/%f' ``` ### 四、集群验证方法 ```sql -- 主节点检查复制状态 SELECT client_addr, state, sync_state FROM pg_stat_replication; -- 从节点验证只读状态 SELECT pg_is_in_recovery(); ``` > **重要提示**: > - 主备节点需保持**时间同步**(NTP服务) > - 生产环境建议使用**VIP**或**HAProxy**实现连接池负载均衡 > - 测试环境可用pgpool-II实现自动故障转移 --- ### 相关延伸问题 1. PostgreSQL流复制延迟如何监控与优化? 2. Patroni集群如何实现滚动升级? 3. 集群环境下如何安全地进行大版本升级? 4. PostgreSQL读写分离如何结合中间件实现? [^1]: PostgreSQL主从复制基础配置 [^2]: 关键配置文件路径说明 [^3]: Patroni高可用集群部署示例 [^4]: PostgreSQL集群性能优势解析 [^5]: 节点数据同步操作命令
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CN華少

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值