【PGCCC】Postgresql BRIN 索引原理

最新推荐文章于 2025-09-10 09:51:07 发布

原创

最新推荐文章于 2025-09-10 09:51:07 发布 · 1.1k 阅读

23 ·

CC 4.0 BY-SA版权

文章标签：

#postgresql #数据库

前言

postgresql 提供了块级索引（简称 BRIN），主要适用于类似时序数据之类的，有着天然的顺序，而且都是添加写的场景。相比于 btree 索引，它的体积小得多，非常适用于大数据量的场景。

原理

postgresql 按照一定的数目（默认 128，可以通过 pages_per_range 指定），将相邻的数据 Block 分成一组，然后计算它的的取值范围。当需要查看数据时，会先遍历这些取值范围。当要查找的数据不在此范围内，则可以直接跳过这些数据 Block。
在这里插入图片描述
当数据按照一定规则新增时，比如监控数据，数据的查找会非常高效。而且块级索引的空间占用会很小，多个相邻的Block才会对应一条索引记录。

如果数据排列的比较随机时，那么索引效果就非常差，因为它起不到快速筛除不符合的数据 Block。造成数据排列乱的原因，还有频繁的删除数据，因为 postgresql 会将删除空间回收掉，后续的数据新增都会填补这些空间。虽然可以配置删除的数据不会回收，但是会造成存储空间浪费，所以块级索引还不适合频繁删除数据的场景。

存储结构

BRIN 也是通过 Page 为基本单位来存储数据的，它有三种类型的 Page，排列如下图所示：
在这里插入图片描述
BRIN 的第一个 Page 是 Meta Page，它存储了整个索引的元信息。数据定义如下：

typedef struct BrinMetaPageData
{
	uint32		brinMagic

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

PGCCC-PostgeSQL培训认证

关注关注

8
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Postgresql杂谈 13—Postgresql中的BRIN索引

Hyman的博客

08-06

2421

一、BRIN索引原理本文我们继续学习下Postgresql中另外一个比较有特色的索引——BRIN索引。BRIN索引是Block Range Index索引的简写，它将数据在磁盘上的block按照一定的数目进行分组，这个数目可以通过创建BRIN时的参数pages_per_range进行设置，默认是128。分组之后，计算每组的取值范围。在查找数据时，会遍历这些取值范围，排除掉不在范围之内的分组。与其它索引不同：（1）BTree等其它索引在查找数据时是根据数...

PostgreSQL 索引管理

分享既学习

06-30

2490

索引是关系型数据库离不开的话题，它是数据库中一种快速查询数据的方法。在 SQL 优化中，创建高性能的索引非常重要，本篇文章将对比 MySQL 介绍 PostgreSQL 的索引管理。

参与评论您还未登录，请先登录后发表或查看评论

PostgreSQL 索引与性能优化详解 —— 从原理到实战

最新发布

csdn_tom_168的博客

09-10

1295

《PostgreSQL索引优化指南》摘要：本文系统讲解PostgreSQL六大索引类型(B-Tree、Hash、GIN等)的核心原理与适用场景，提供索引选型速查表。重点剖析多列索引顺序策略、部分索引、表达式索引等高级技巧，并给出覆盖索引、并发建索引等性能优化方案。通过大量SQL示例演示如何为JSONB、数组、时间序列等特殊场景设计高效索引，同时强调索引的读写平衡原则，帮助开发者在查询性能与写入开销间取得最佳平衡。

PostgreSQL BRIN索引详解

Focus on PostgreSQL

12-30

4535

pg9.5增加的brin索引，存储了被索引字段在块级别的边界值（最大值、最小值）以及其他统计信息。 BRIN索引的扫描原理很简单，扫描BRIN的元数据，根据元数据和用户输入的条件进行比较，过滤不符合条件的HEAP PAGE，只扫描需要扫描的HEAP PAGE。所以brin索引仅仅适合存储与值线性相关性很好的列。例子：我们创建两张表，一张表插入线性相关很好的数据，另一张表插入离散的数据来测试b...

PostgreSQL 9种索引的原理和应用场景

weixin_34318956的博客

06-28

1159

标签 PostgreSQL , btree , hash , gin , gist , sp-gist , brin , bloom , rum , zombodb , bitmap 背景 PostgreSQL 拥有众多开放特性，例如 1、开放的数据类型接口，使得PG支持超级丰富的数据类型，除了传统数据库支持的类型，还支持GIS，JSON，RANGE...

postgresql索引类型

weixin_30723433的博客

03-26

237

索引查看 SELECT A.SCHEMANAME, A.TABLENAME, A.INDEXNAME, A.TABLESPACE, A.INDEXDEF, B.AMNAME, C.INDEXRELID, C.INDNATTS, C.INDISUNIQUE, C.INDISPRIMARY, C.INDISCLUSTERED, ...

PostgreSQL17索引优化之支持并行创建BRIN索引

m0_61738548的博客

07-12

674

PostgreSQL17索引优化之支持并行创建BRIN索引

6-PostgreSQL 哈希索引原理浅析.pdf

08-07

本文详细分析了PostgreSQL中哈希索引的实现原理，从基础知识到核心算法，再到实际应用和限制，对PostgreSQL哈希索引的理解进行了全面的探讨。通过这些知识点，我们可以对PostgreSQL数据库中哈希索引的性能和功能有一...

PostgreSQL专栏：索引原理与应用深度解析

苦哈哈的 C++ 程序员，写这个技术博客不是为了装逼，也不是为了立人设，是为了收割流量

08-12

1165

- 场景：电商订单表，设计合适的索引-- 常见查询模式：-- 1. 查询客户的所有订单：WHERE customer_id =?-- 2. 查询特定状态的订单：WHERE status =?-- 3. 查询时间范围内的订单：WHERE order_date BETWEEN?AND?-- 4. 客户最近订单：WHERE customer_id =?-- 推荐索引设计索引类型原理：B-tree、Hash、GIN、GiST、BRIN的结构和适用场景复合索引设计。

PostgreSQL BTree(B-Link-tree) 索引基本实现原理

天行健，地势坤

06-18

5690

BTree， B+Tree, B-Link-Tree 基本实现以及其在 PostgreSQL 中的基本实现（并发控制、Crash-Recovery 场景的异常恢复）

掌握查询利器深入理解PostgreSQL索引原理与优化

热门推荐

陈书予

03-19

1万+

PostgreSQL索引是数据库性能优化中很重要的一个方向，合理使用索引可以有效提升数据库的查询效率。在PostgreSQL中，索引机制是为了更快地寻找某个值而构建的。PostgreSQL索引可加速搜索操作，当数据表中的数据行太多时，没有索引会影响性能，影响查询速度，而索引能够提供快速查找数据的能力，除了基础索引外，还有B树索引、哈希索引、GiST索引、GIN索引等，各种索引类型的执行效率不同，如果我们使用恰当的索引，可以显著提高数据库表数据的查询效率。

进阶数据库系列（十二）：PostgreSQL 索引技术详解

民工哥的博客

07-10

7366

点击下方名片，设为星标！回复“1024”获取2TB学习资源！前面介绍了PostgreSQL 数据类型和运算符、常用函数、锁操作、执行计划、视图与触发器、存储过程相关的知识点，今天将为大家介绍 PostgreSQL 索引相关知识，希望大家能够从中收获多多！如有帮助，请点在看、转发支持一波！！！概述索引主要被用来提升数据库性能，不当的使用会导致性能变差。 PostgreSQL 提供了多种索引类型：...

PostgreSQL索引（一）

NOSaac的博客

09-10

9730

PostgreSQL索引（一）

PostgreSQL技术内幕6：PostgreSQL索引技术

qq_40529346的博客

09-01

3216

本文主要介绍PG的索引技术，包含PG支持的索引类型，语法，查看方式，以及其中B-Tree索引的原理解析和源码解读。

PostgreSQL中的索引—9（BRIN）

Michaelia_hu的博客

11-11

1705

本文的主题是PG数据库中的BRIN索引。

PostgreSQL 索引类型详解

qq_34692500的博客

07-08

1742

索引类型B-tree 索引：适用场景：范围查询、等值查询、排序操作。特点：适用于大部分查询场景，是 PostgreSQL 默认的索引类型。哈希索引：适用场景：等值查询，对于频繁的等值查询有性能优势。特点：不支持范围查询和排序操作，大小写敏感。GIN 索引：适用场景：全文搜索、数组包含查询、JSONB 数据类型查询。特点：支持对复杂查询条件的优化，如使用数组和 JSONB 类型的数据。GiST 索引...

postgres源码解析54 Brin Index--1

Serendipity_Shy

09-02

1120

brin index是Block range Index的缩写，顾名思义该索引是指块范围索引，该索引适合在超大表中进行过滤性扫描。基本的思路是追踪heap页域的最大值与最小值，用于过滤不符合条件的数据块。以下图为例，右边的堆表包含三个block，第一个block中有4个tuple，字段上的值分别是1、3、5、7。因此，与这个block相对应的Brin的元组就记录了 block的最小值1，最大值7。同理，2、4、6、8的最小值是2，最大值是8；12、11、10、12的最小值是10，最大值是14。

PostgreSQL中的BRIN索引：大数据量场景下的高效索引方案

neweastsun的专栏

07-07

958

在PostgreSQL数据库中，当面对海量数据表的查询优化时，传统B-tree索引可能面临存储空间大、维护成本高的问题。**BRIN索引(Block Range INdex)**作为一种特殊的索引类型，专门为大数据量场景设计，能够在极小的存储开销下提供高效的查询性能。本文将深入介绍BRIN索引的工作原理、适用场景、创建方法、性能优化技巧，并通过实际案例展示其应用效果。

brin索引

07-16

### BRIN索引原理及在PostgreSQL中的应用 BRIN（Block Range INdex）索引是PostgreSQL中为处理大规模数据集而设计的一种稀疏索引结构。与传统的B-tree索引不同，BRIN索引不存储每个键值的精确位置，而是将表的数据划分为多个块范围（block ranges），并在每个范围内记录该范围内的最小值和最大值等统计信息[^1]。 #### 工作原理 - **数据划分**：BRIN索引将整个表的数据分成若干个连续的块范围。每个块范围包含一定数量的数据页。 - **元数据记录**：对于每一个块范围，BRIN索引会记录下这个范围内各个字段的汇总信息，比如最小值、最大值以及非空值的数量等。 - **查询优化**：当执行查询时，数据库引擎利用这些汇总信息快速判断哪些块范围可能包含满足查询条件的数据，从而减少需要访问的数据量[^1]。 #### 适用场景 - **大数据量表**：BRIN索引特别适合于那些拥有数十亿行甚至更多记录的大表。 - **时间序列数据**：如果数据具有时间顺序特性，并且经常按照时间进行过滤或聚合操作，则非常适合使用BRIN索引。 - **低选择性列**：对于那些具有较低选择性的列（即重复值较多的列），如状态码或者类别标识等，BRIN索引也能提供良好的性能提升[^3]。 #### 创建方法创建BRIN索引的基本语法如下所示： ```sql CREATE INDEX index_name ON table_name USING BRIN (column_name); ``` 此外，还可以通过指定`pages_per_range`参数来调整每个块范围所覆盖的数据页数，以适应不同的工作负载需求。例如： ```sql CREATE INDEX idx_brin_custom ON my_table USING BRIN (log_date) WITH (pages_per_range=32); ``` #### 性能优化技巧 - **合理设置pages_per_range**：较大的`pages_per_range`值可以降低索引大小，但可能会导致更多的磁盘I/O；较小的值则相反。根据实际测试结果调整此参数可以获得最佳平衡点。 - **多列索引**：虽然单列BRIN索引已经非常高效，但在某些情况下创建多列BRIN索引也可能是有益的，尤其是当多个列一起用于查询条件中时[^4]。 - **定期维护**：尽管BRIN索引维护成本相对较低，但随着时间推移，随着数据分布的变化，其效率也可能下降。因此，建议定期对相关表执行VACUUM命令以更新统计信息并保持索引的有效性。 #### 实际案例应用效果在一个典型的日志分析系统中，假设存在一张每天新增数百万条记录的日志表，其中包含了事件发生的时间戳、用户ID以及其他相关信息。通过对时间戳列建立BRIN索引，即使面对海量数据，也可以显著加快基于时间窗口的查询速度，同时由于索引体积小巧，对存储空间的要求也远低于传统B-tree索引方案。