问三个礼拜PostgreSQL问题的那同学,希望这篇让你PG之路一切顺遂

开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, OceanBase, Sql Server等有问题,有需求都可以加群群内有各大数据库行业大咖,可以解决你的问题。加群请联系 liuaustin3 ,(共3300人左右 1 + 2 + 3 + 4 +5 + 6 + 7 + 8 +9)(1 2 3 4 5 6 7群均已爆满,开8群近400 9群 200+,开10群PolarDB专业学习群 7月份开课)

PostgreSQL 数据库开源版本的使用中在归档中容易出现问题,这也是最近有同学在询问并且产生问题的地方,实际上他已经问了我3个礼拜了,各种各样的问题,本篇将针对这个问题进行梳理,方便同学在安装和设置PostgreSQL的工作中遇到问题进行问题对的排查,所以千万别拿PostgreSQL当MySQL,他比那个MySQL要难得多,关联性问题比较多,顾此失彼想问题的不少。

首先我们先用一个 PostgreSQL 归档中的问题与配置注意点 的思维导图输出,以文本和层级结构的形式展现:

PostgreSQL WAL 归档:问题与配置要点

├── 1. 归档中的常见问题
│   ├── 1.1 WAL 文件堆积 (磁盘空间耗尽)
│   │   ├── 原因
│   │   │   ├── archive_command 执行失败/过慢
│   │   │   ├── 目标存储空间不足
│   │   │   ├── 权限问题
│   │   │   ├── 复制槽 (Replication Slots) 未清理/卡顿
│   │   │   └── wal_keep_size 设置过高
│   ├── 1.2 归档数据丢失/不完整
│   │   ├── 原因
│   │   │   ├── archive_command 未正确返回成功状态
│   │   │   ├── 网络/存储设备故障
│   │   │   ├── 归档脚本逻辑错误
│   │   │   └── 缺乏基础备份 (无法单独恢复)
│   ├── 1.3 恢复过程复杂/失败
│   │   ├── 原因
│   │   │   ├── 基础备份与 WAL 归档不匹配
│   │   │   ├── restore_command 配置错误
│   │   │   ├── WAL 文件损坏/缺失
│   │   │   ├── 归档文件压缩/解压问题
│   │   │   └── 归档目录结构混乱
│   └── 1.4 性能开销
│       ├── 原因
│       │   └── archive_command 消耗资源过多 (CPU/I/O)
│
├── 2. 归档配置的注意点 (postgresql.conf & 脚本)
│   ├── 2.1 postgresql.conf 参数
│   │   ├── wal_level
│   │   │   ├── 必须: replica/archive (旧版本), logical
│   │   │   └── 勿设: minimal
│   │   ├── archive_mode
│   │   │   └── 必须: on
│   │   ├── archive_command
│   │   │   ├── 核心:shell 命令,处理 %p (路径) & %f (文件名)
│   │   │   ├── 关键点
│   │   │   │   ├── 幂等性 (处理重复调用)
│   │   │   │   ├── 原子性 (先临时复制,后原子重命名)
│   │   │   │   ├── 成功退出码 (必须返回 0)
│   │   │   │   ├── 错误处理与日志记录
│   │   │   │   └── 权限 (Pg 用户对目标目录有写权限)
│   │   │   ├── 常用功能
│   │   │   │   ├── 压缩 (gzip)
│   │   │   │   └── 远程传输 (scp, rsync, S3 tools)
│   │   │   └── 容易出错
│   │   │       ├── 命令语法错误
│   │   │       ├── 硬编码路径
│   │   │       ├── 缺乏错误处理
│   │   │       └── 权限不足
│   │   ├── archive_timeout
│   │   │   ├── 作用:强制切换 WAL 段并归档 (即使未满)
│   │   │   └── 建议:低事务量时可设较小值 (如 60s, 300s)
│   │   └── wal_keep_size (或 wal_keep_segments)
│   │       ├── 作用:保留 WAL 文件供备库使用
│   │       ├── 建议:使用复制槽时可设为 0 (或很小)
│   │       └── 注意:过大导致本地磁盘空间浪费
│   ├── 2.2 基础备份 (Base Backup)
│   │   ├── 作用:PITR 的起点
│   │   ├── 工具:pg_basebackup
│   │   └── 最佳实践:定期全量备份,确保与 WAL 归档匹配
│   └── 2.3 恢复命令 (restore_command)
│       ├── 作用:在恢复时获取 WAL 文件
│       ├── 关键点:与 archive_command 对应 (路径,压缩/解压)
│       └── 容易出错:路径不匹配,权限问题,文件缺失/损坏
│
└── 3. 容易出现问题的地方与管理建议
    ├── 3.1 磁盘空间管理
    │   ├── 监控:主库 pg_wal 目录
    │   └── 监控:归档目标存储空间
    ├── 3.2 权限问题
    │   └── 确保 Pg 用户对归档相关目录/文件有读写权限
    ├── 3.3 archive_command 脚本的健壮性
    │   ├── 测试:充分测试各种场景 (成功,失败,重复)
    │   ├── 日志:内部记录详细日志
    │   └── 错误处理:正确返回退出码
    ├── 3.4 复制槽 (Replication Slots) 的使用与管理
    │   ├── 优势:确保 WAL 不被删除
    │   ├── 风险:备库卡顿导致 WAL 无限增长
    │   ├── 管理:
    │   │   ├── 监控 pg_replication_slots 视图
    │   │   ├── 设置 max_slot_wal_keep_size 上限
    │   │   └── 及时清理不再使用的复制槽
    ├── 3.5 灾难恢复演练
    │   ├── 重要性:定期演练 (季度/半年)
    │   └── 自动化:尽可能自动化恢复流程
    └── 3.6 监控和告警
        ├── 监控:pg_stat_archiver (归档成功/失败计数)
        ├── 监控:磁盘空间 (pg_wal, 归档目录)
        └── 监控:复制延迟 (结合流复制)

这里我们列出了在工作中容易产生问题的部分的列表,并且针对最近同学私信我的实际问题进行问题的描述和解决方案的给出。

咨询中第一个问题:

我是否可以将pg_waL的数据的日志目录,放到更廉价的磁盘系统中,主要产生这样想法的原因在于,pg_wal在使用中会产生大量的文件,而系统中做了主从且从库还要进行报表的给出,且还设置了从库强一致的设置,这里主库的日志有大量堆积的情况出现。

答:我们非常不建议将pg_wal放入目录单独放入到比较差的磁盘系统,这主要与pg_wal对于postgresql系统运行的性能起到了至关重要作用有关。

数据库事务的commit的效率与系统运行的性能有着直接的关系,事务的commit是需要等待事物日志落盘后才能进行事务的commit,如果将日志放到较差的磁盘系统中将直接影响整体数据苦的稳定运行。

而产生一些运维同学想把日志放到廉价磁盘的根本原因就是PostgreSQL FPW full page write ,在每次checkpoint后会将数据的首页面的数据页面写入到日志,保证数据库系统CRASH后的数据库页面出现问题后的恢复,越是繁忙的系统FPW产生的数据页面就越大PG_WAL就越大,硬盘的性能需求就越大。

所以同学问是否可以将PG_WAL,放入到廉价的系统,回答是不可以。

第二个问题,pg_wal能否进行压缩,这里建议如果想在核心系统上使用PostgreSQL建议考虑硬件压缩你的日志。从磁盘本身来进行数据的压缩。

Btrfs:支持在挂载时启用透明压缩。

ZFS:也提供透明压缩选项。

第三个问题,WAL的归档为什么拷贝到了归档的目录,PG_WAL的文件数还是没有下来,PG_WAL的文件夹的文件数还是那么的多。

这里我们需要注意我们的./pg_wal/archive_status/ 文件夹下的目录里面的文件是会显示每个文件的归档状态的结尾是.done 是归档完毕的,而.ready的意思是这个问题已经做好了要归档的准备。

真正的第三个问题,也就是那个同学一直在3个礼拜一直归档失败,PG_WAL被沾满影响数据库系统运行的核心就是,逻辑复制槽。

这里这个同学的公司有大数据部门,大数据会通过逻辑复制槽来消费数据,而大数据是不会管你数据库的死活,他们有如下的可能我们也是遇到的。

1 大数据更换逻辑复制槽来进行数据的同步,但原理的复制槽不使用并不会通知DBA,这就导致PG_WAL 一直下不去的根本原因。

2 大数据消费PG_WAL非常慢,导致他们消费不了PG_WAL而逻辑复制槽又必须等着他们消费完才能删除PG_WAL

3 网络的问题,或者大数据的磁盘满了,不消费了等等各种各样的问题。

所以如果你发现你的系统开了逻辑复制槽,就必须监控。

下面我们给大家一个关于逻辑复制槽的周边。

-- 1. 查看所有逻辑复制槽(slot_type = 'logical')
SELECT * 
FROM pg_replication_slots 
WHERE slot_type = 'logical';

-- 2. 判断复制槽是否存在(替换 'your_slot_name')
SELECT EXISTS (
  SELECT 1 
  FROM pg_replication_slots 
  WHERE slot_type = 'logical' AND slot_name = 'your_slot_name'
) AS slot_exists;

-- 3. 查看逻辑复制槽是否活跃(active 表示是否被订阅端占用)
SELECT 
  slot_name, 
  active 
FROM pg_replication_slots 
WHERE slot_type = 'logical';

-- 4. 检查逻辑槽延迟(WAL 堆积字节数),判断是否可能失效或卡住
SELECT 
  slot_name,
  active,
  pg_size_pretty(pg_wal_lsn_diff(pg_current_wal_lsn(), confirmed_flush_lsn)) AS wal_delay,
  pg_current_wal_lsn() AS current_lsn,
  confirmed_flush_lsn
FROM pg_replication_slots 
WHERE slot_type = 'logical';

-- 5. 查看逻辑订阅延迟(订阅端使用,查询 pg_stat_subscription)
SELECT 
  subscription_name,
  received_lsn,
  latest_end_lsn,
  latest_end_time,
  now() AS now,
  EXTRACT(EPOCH FROM now() - latest_end_time)::int AS delay_seconds
FROM pg_stat_subscription;

-- 6. 查看 replication 连接状态(发布端,用于逻辑复制进程的状态)
SELECT 
  pid,
  application_name,
  state,
  client_addr,
  sync_state,
  pg_size_pretty(pg_wal_lsn_diff(pg_current_wal_lsn(), flush_lsn)) AS flush_lag,
  pg_size_pretty(pg_wal_lsn_diff(pg_current_w_

另外,这个同学后面又遇到了,系统重启后,从库连不上了问题,从库报找不到pg_wal的问题。

requested WAL segment has already been removed

could not receive data from WAL stream

这里我给你的的建议是设置如下参数会解决这个问题

# postgresql.conf 主库设置
wal_keep_size = '1GB'  (具体设置多少根据你的情况而定,这个保留可以归档但不归档还放到pg_wal目录下的日志文件的大小)

写到这里,我认为基本上对于这个同学在这三个礼拜问的问题,我已经梳理了他遇到的大部分和未来可能会遇到的问题,以及解决方案,希望能对他有帮助。

PolarDB 已经开放的课程

PolarDB 非官方课程第七节--数据备份还原瞬间完成是怎么做到的--答题领奖品

PolarDB 非官方课程第六节--数据库归档还能这么玩--答题领奖品

PolarDB 非官方课程第五节--PolarDB代理很重要吗?--答题领奖品

PolarDB 非官方课程第四节--PG实时物化视图与行列数据整合处理--答题领奖品

PolarDB 非官方课程第三节--MySQL+IMCI=性能怪兽--答题领奖品

PolarDB 非官方课程第二节--云原生架构与特有功能---答题领奖品

PolarDB 非官方课程第一节-- 用户角度怎么看PolarDB --答题领奖品

免费PolarDB云原生课程,听课“争”礼品,重塑云上知识,提高专业能力

置顶

Oracle “嫁给” AWS-疯狂的Oracle 疯狂的计划  -- 另附DBA 招聘信息 附带薪资待遇

从MySQL不行了,到乙方DBA 给狗,狗都不干? 我干呀!

OceanBase Hybrid search 能力测试,平换MySQL的好选择

HyBrid Search 实现价值落地,从真实企业的需求角度分析 !不只谈技术!

一个IP地址访问两个PG实例,上演“一女嫁二夫”的戏码

OceanBase 光速快递 OB Cloud “MySQL” 给我,Thanks a lot

从“小偷”开始,不会从“强盗”结束 -- IvorySQL 2025 PostgreSQL 生态大会

被骂后的文字--技术人不脱离思维困局,终局是个 “死” ? ! ......

9个群2025上半年总结,OB、PolarDB, DBdoctor、爱可生、pigsty、osyun、工作岗位等

卷呀卷,Hybrid 混合查询学习--哪个库是小趴菜

用MySQL 分区表脑子有水!从实例,业务,开发角度分析 PolarDB 使用不会像MySQL那么Low

云数据库产品应改造PostgreSQL逻辑复制槽缺陷--来自真实企业的需求

泉城济南IvorySQL 2025 “雷暴云” 就在云和云原生会场

DBA 干不好容易蹲牢房--这事你知道吗?

SQL SERVER 2025发布了, China幸亏有信创!

MongoDB 麻烦专业点,不懂可以问,别这么用行吗 ! --TTL

P-MySQL SQL优化案例,反观MySQL不死没有天理

MySQL 条件下推与排序优化实例--MySQL8.035

云数据库厂商除了卷技术,下一个阶段还可以卷什么?

PostgreSQL 新版本就一定好--由培训现象让我做的实验

某数据库下的一手好棋!共享存储落子了!

删除数据“八扇屏” 之 锦门英豪  --我去-BigData!

PostgreSQL “乱弹” 从索引性能到开发优化

写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》

SQLSHIFT 是爱可生对OB的雪中送炭!

青春的记忆,MySQL 30年感谢有你,再见!(译)

老实人做的数据库产品,好像也不“老实” !

疯狂老DBA 和 年轻“网红” 程序员 --火星撞地球-- 谁也不是怂货  

哈呀站,OB广州开发者大会 之 “五” 眼联盟

和架构师沟通那种“一坨”的系统,推荐只能是OceanBase,Why ?

OceanBase 相关文章

某数据库下的一手好棋!共享存储落子了!

写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》

     哈呀站,OB广州开发者大会 之 “五” 眼联盟

OceanBase 单机版可以大批量快速部署吗? YES

OceanBase 6大学习法--OBCA视频学习总结第六章

OceanBase 6大学习法--OBCA视频学习总结第五章--索引与表设计

OceanBase 6大学习法--OBCA视频学习总结第五章--开发与库表设计

OceanBase 6大学习法--OBCA视频学习总结第四章 --数据库安装

OceanBase 6大学习法--OBCA视频学习总结第三章--数据库引擎

OceanBase 架构学习--OB上手视频学习总结第二章 (OBCA)

OceanBase 6大学习法--OB上手视频学习总结第一章

没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛

OceanBase  送祝福活动,礼物和幸运带给您

跟我学OceanBase4.0 --阅读白皮书 (OB分布式优化哪里了提高了速度)

跟我学OceanBase4.0 --阅读白皮书 (4.0优化的核心点是什么)

跟我学OceanBase4.0 --阅读白皮书 (0.5-4.0的架构与之前架构特点)

跟我学OceanBase4.0 --阅读白皮书 (旧的概念害死人呀,更新知识和理念)

聚焦SaaS类企业数据库选型(技术、成本、合规、地缘政治)

OceanBase 学习记录-- 建立MySQL租户,像用MySQL一样使用OB
         MongoDB 相关文章

MongoDB “升级项目” 大型连续剧(4)-- 与开发和架构沟通与扫尾

MongoDB “升级项目” 大型连续剧(3)-- 自动校对代码与注意事项

MongoDB “升级项目” 大型连续剧(2)-- 到底谁是"der"

MongoDB “升级项目”  大型连续剧(1)-- 可“生”可不升

MongoDB  大俗大雅,上来问分片真三俗 -- 4 分什么分

MongoDB 大俗大雅,高端知识讲“庸俗” --3 奇葩数据更新方法

MongoDB 学习建模与设计思路--统计数据更新案例

MongoDB  大俗大雅,高端的知识讲“通俗” -- 2 嵌套和引用

MongoDB  大俗大雅,高端的知识讲“低俗” -- 1 什么叫多模

MongoDB 合作考试报销活动 贴附属,MongoDB基础知识速通

MongoDB 年底活动,免费考试名额 7个公众号获得

MongoDB 使用网上妙招,直接DOWN机---清理表碎片导致的灾祸 (送书活动结束)

MongoDB 2023年度纽约 MongoDB 年度大会话题 -- MongoDB 数据模式与建模

MongoDB  双机热备那篇文章是  “毒”

MongoDB   会丢数据吗?在次补刀MongoDB  双机热备

MONGODB  ---- Austindatabases  历年文章合集

PolarDB 相关文章

用MySQL 分区表脑子有水!从实例,业务,开发角度分析 PolarDB 使用不会像MySQL那么Low

P-MySQL SQL优化案例,反观MySQL不死没有天理

MySQL 和 PostgreSQL 可以一起快速发展,提供更多的功能?

这个MySQL说“云上自建的MySQL”都是”小垃圾“

        PolarDB MySQL 加索引卡主的整体解决方案

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL 的搅局者问世了,杀过来了!

在被厂商围剿的DBA 求生之路 --我是老油条

POLARDB  添加字段 “卡” 住---这锅Polar不背

PolarDB 版本差异分析--外人不知道的秘密(谁是绵羊,谁是怪兽)

在被厂商围剿的DBA 求生之路 --我是老油条

PolarDB 答题拿-- 飞刀总的书、同款卫衣、T恤,来自杭州的Package(活动结束了)

PolarDB for MySQL 三大核心之一POLARFS 今天扒开它--- 嘛是火

PostgreSQL 相关文章

一个IP地址访问两个PG实例,上演“一女嫁二夫”的戏码

PostgreSQL  Hybrid能力岂非“小趴菜”数据库可比 ?

PostgreSQL 新版本就一定好--由培训现象让我做的实验

PostgreSQL “乱弹” 从索引性能到开发优化

PostgreSQL  无服务 Neon and Aurora 新技术下的新经济模式 (翻译)

PostgreSQL的"犄角旮旯"的参数捋一捋

PostgreSQL逻辑复制槽功能

PostgreSQL 扫盲贴 常用的监控分析脚本

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL  添加索引导致崩溃,参数调整需谨慎--文档未必完全覆盖场景

PostgreSQL 的搅局者问世了,杀过来了!

PostgreSQL SQL优化用兵法,优化后提高 140倍速度

PostgreSQL 运维的难与“难”  --上海PG大会主题记录

PostgreSQL 什么都能存,什么都能塞 --- 你能成熟一点吗?

PostgreSQL 迁移用户很简单 ---  我看你的好戏

PostgreSQL 用户胡作非为只能受着 --- 警告他

全世界都在“搞” PostgreSQL ,从Oracle 得到一个“馊主意”开始
PostgreSQL 加索引系统OOM 怨我了--- 不怨你怨谁

PostgreSQL “我怎么就连个数据库都不会建?” --- 你还真不会!

病毒攻击PostgreSQL暴力破解系统,防范加固系统方案(内附分析日志脚本)

PostgreSQL 远程管理越来越简单,6个自动化脚本开胃菜

PostgreSQL 稳定性平台 PG中文社区大会--杭州来去匆匆

PostgreSQL 如何通过工具来分析PG 内存泄露

PostgreSQL  分组查询可以不进行全表扫描吗?速度提高上千倍?

POSTGRESQL --Austindatabaes 历年文章整理

PostgreSQL  查询语句开发写不好是必然,不是PG的锅

PostgreSQL  字符集乌龙导致数据查询排序的问题,与 MySQL 稳定 "PG不稳定"

PostgreSQL  Patroni 3.0 新功能规划 2023年 纽约PG 大会 (音译)

PostgreSQL   玩PG我们是认真的,vacuum 稳定性平台我们有了

PostgreSQL DBA硬扛 垃圾 “开发”,“架构师”,滥用PG 你们滚出 !(附送定期清理连接脚本)

DBA 失职导致 PostgreSQL 日志疯涨

MySQL相关文章

MySQL 条件下推与排序优化实例--MySQL8.035

青春的记忆,MySQL 30年感谢有你,再见!(译)

MySQL 8 SQL 优化两则 ---常见问题

MySQL SQL优化快速定位案例 与 优化思维导图

"DBA 是个der" 吵出MySQL主键问题多种解决方案

MySQL 怎么让自己更高级---从内存表说到了开发方式

MySQL timeout 参数可以让事务不完全回滚

MySQL 让你还用5.7 出事了吧,用着用着5.7崩了

MySQL 的SQL引擎很差吗?由一个同学提出问题引出的实验

用MySql不是MySQL, 不用MySQL都是MySQL 横批 哼哼哈哈啊啊

MYSQL  --Austindatabases 历年文章合集

临时工访谈系列

没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛

ETL 行业也够卷,云化ETL,ETL 软件不过了

SQL SERVER 系列

SQL SERVER维保AI化,从一段小故事开始

SQL SERVER 如何实现UNDO REDO 和PostgreSQL 有近亲关系吗

SQL SERVER 危险中,标题不让发,进入看详情(译)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值