PG数据库wal日志空间异常

最新推荐文章于 2025-10-17 20:28:33 发布

原创

最新推荐文章于 2025-10-17 20:28:33 发布 · 2.4k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#big data #postgresql #数据库

本文详细介绍了如何处理PostgreSQL数据库wal日志空间使用率达到97%的问题。首先检查wal相关参数，如max_wal_size、min_wal_size等，确认设置是否合理。接着排查可能导致wal日志无法正常清理的情况，例如逻辑复制订阅端异常。在确认问题在于废弃的逻辑复制槽后，通过删除复制槽并进行checkpoint操作，成功清理wal日志，降低了空间占用。

问题描述

PG数据库实例磁盘空间使用率高达97%，其中wal空间使用量占用32G，相对比较异常。

在这里插入图片描述

处理思路

wal日志是PG数据库的事务预写日志，对于数据库的一个变更操作，数据库流程大概如下：
● 客户端执行DML操作进行数据变更
● 将相关的变更数据页写入wal buffer，对应的数据更新写到内存中的数据页（脏页）
● 事务commit时，wal buffer进行刷盘，写入到wal log，该步骤已经保证了数据不会丢失
● 周期性checkpoint出发将内存中的脏页进行刷盘

对于wal日志，PG数据库也提供了一些参数以及机制保证wal日志可周期性的进行归档，并控制相关大小，通过checkpoint来将历史无效的wal历史进行清理，从而避免wal日志占用过大的空间。所以针对wal日志两空间使用较大的情况，我们可以分两步去排查：
1）检查wal相关参数
● max_wal_size( integer) ：两次checkpoint之间允许的最大wal日志大小，这是一个软限制，当重负载、失败archive_command等情况下可能超出该参数设置大小。增加此参数会增加崩溃恢复所需的时
● min_wal_size( integer) ：只要 WAL 磁盘使用率保持在此设置以下，旧的 WAL 文件总是会在检查点被回收以备将来使用，而不是被删除。这可用于确保保留足够的 WAL 空间来处理 WAL 使用量的峰值，例如在运行大型批处理作业时。
● wal_keep_segments ：主节点数据库为standby节点保留的最大wal log数量
● wal_level ： wal日志记录模式
2）在参数设置正常的情况下，定位一些可能会导致wal日志无法正常清理的情况
● standby数据库实例复制存在一定的异常，导致主节点保存大量的wal日志
● 逻辑复制订阅端数据消费异常，导致发布节点堆积大量的wal日志

处理过程

1、检查wal相关参数
可以看到wal相关的参数设置基本都是正常的，wal_level设置为logical，一定程度上会增大wal日志空间使用量，但是也不至于会导致wal日志量使用高达32G


psql=#SELECT * FROM pg_settings where name like '%wal%'
+------------------------------+-------------------+----------------+-------------------------------+---------------------------------------------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------+-------------------+-------------------+--------------------+-------------------+-------------------+-------------------------------------------+--------------------+---------------------+----------------------+----------------------+---------------------------+
| NAME                         | SETTING           | UNIT           | CATEGORY                      | SHORT_DESC                                                                                              | EXTRA_DESC                                                                                               | CONTEXT           | VARTYPE           | SOURCE             | MIN_VAL           | MAX_VAL           | ENUMVALS                                  | BOOT_VAL           | RESET_VAL           | SOURCEFILE           | SOURCELINE           | PENDING_RESTART           |
+------------------------------+-------------------+----------------+-------------------------------+---------------------------------------------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------+-------------------+-------------------+--------------------+-------------------+-------------------+-------------------------------------------+--------------------+---------------------+----------------------+----------------------+---------------------------+
| max_wal_senders              | 20                |                | Replication / Sending Servers | Sets the maximum number of simultaneously running WAL sender processes.                                 |                                                                                                          | postmaster        | integer           | configuration file | 0                 | 262143            |