前言
在对 Postgres 数据库进行建模时,您可能不会过多考虑表中列的顺序。毕竟,这似乎是不会影响存储或性能的事情。但如果我告诉您,只需重新排列列就可以将表和索引的大小减少 20%,您会怎么想?这不是什么晦涩难懂的数据库技巧——这是 Postgres 如何对齐磁盘上数据的直接结果。
在这篇文章中,我将探讨 Postgres 中的列对齐工作原理、它的重要性以及如何优化表以提高效率。通过几个真实示例,您将看到即使列顺序的微小变化也能带来可衡量的改进。
称量一行
作为表行布局的直接结果,一行的最小可能大小为 24 字节。
SELECT pg_column_size(ROW());
pg_column_size
----------------
24
然后,对于在行中添加的每个新列,它将占用更多的空间:
-- One column of type integer: 24 + 4 = 28 bytes
SELECT pg_column_size(ROW(1::int));
pg_column_size
----------------
28
-- Integer + smallint columns: 24 + 4 + 2 = 30 bytes
SELECT pg_column_size(ROW(1::int, 1::smallint));
pg_column_size
----------------
30
到目前为止一切顺利。这正是您所期望的:行中的数据越多,它占用的磁盘空间就越大。磁盘使用量与数据类型成正比。
换句话说,如果我们有一个整数列,我们期望行大小为 24 + 4 = 28 字节。如果我们有一个整数列和一个 smallint 列

最低0.47元/天 解锁文章
2400

被折叠的 条评论
为什么被折叠?



