PostgreSQL的存储空间(六)
PostgreSQL 入门系列博文讲解(B站同步介绍视频:https://space.bilibili.com/282421760)
支持一下,关注一波微信公众号:【 钥道不止 】
1. 前序
回顾:【 PG 入门系列 】PostgreSQL体系结构(三)
2. 表空间
- 表空间可以让我们将不同的表存放在不同的目录下
- 通过文件系统的分离,优化存储空间和I/O吞吐
CREATE TABLESPACE tablespace_name [ OWNER owner_name ] LOCATION 'directory'
[ WITH ( tablespace_option = value [, ... ] ) ]
3. 数据库
- 同一数据库簇下的不同数据库之间相互独立
- 缺省会调用 template1 作为新建数据库的模板
- template1 可以连接并创建对象,template0 不可以连接
- 使用 template1 模板库建库时不可指定新的 encoding 和 locale,而 template0 可以
- 不要对template0模板数据库做任何修改,这是原始的干净模板,如果其它模板数据库被搞坏了,基于这个数据库做一个副本就可以了
- Tablespace会设置该数据库的缺省表空间
- 不同数据库之间无法跨库访问
# 查看数据库的三种方法
-- 方式一:OS层面使用PG自带的 oid2name 查看数据库的oid和库名
oid2name
-- 方式二:psql 进数据库用元命令查看
\l+
-- 方式三:psql 进数据库查看pg_database系统视图
select oid,datname from pg_database;
# 默认模板数据库为:template1;指定 TEMPLATE 属性可手工指定模板库为:template0
create database tempdb1 template template0;
# 创建失败,使用 template1 模板库建库时不可指定新的 encoding 和 locale
create database tempdb2 TEMPLATE template1 ENCODING ‘SQL_ASCII’ ;
# 创建成功
create database tempdb3 TEMPLATE template0 ENCODING ‘SQL_ASCII’ ;
4. 页
页(Page)又称数据块(Block),是PostgreSQL中的I/O的最小单元。数据块的大小缺省是8KB,1~32KB之间2的次幂
- Page Header:块头,包括LSN、Checksum、空闲空间起至位置等Page的基本信息,指向空闲空间(free space),长为24bytes
- ItemIdData(Row/Index Pointers):行指针,纪录偏移量/长度(offset/length)的数组,指向实际的纪录(rows/index entries),每个item 4字节
- Free Space:未分配的空间,新指针(Pointers)从这个区域的开头开始分配;新的纪录(rows/index entries)从结尾开始分配
- items(rows/index entries):实际的纪录本身
- Special:特殊数据,不同的索引访问方式相关的数据,在普通表中为空
5. Tuple
Tuple就是数据行(row)
5.1 Tuple头部包括
- xmin:事务控制信息
- xmax :事务控制信息
- cid :命令编号
- ctid:行号
- infomask2:字段数
- infomask:可见性信息
- hoff:header长度
- 可选null bitmap:字段是否为空位图
6. 空闲空间管理
- PG使用Free Space Map(FSM)文件管理空闲空间,每个数据表文件都会对应一个_fsm文件
- FSM文件实际上是一个3层的B-TREE的索引结构,用于快速空间检索
- FSM文件使用一个字节来记录一个数据块的空闲空间大小的范围,即0~255的值表示以32字节为间隔区间的空闲空间,该字节若为N,那么空闲空间范围为N*32~(N+1)*32-1,若N=3,那么空闲空间范围为96~127
7. 可见性映射文件
- 当数据被更新或删除后,即使事务提交了也不会马上能够被重复利用,要进行空间回收(VACCUM)
- PG使用可见性映射文件(Visibility Map File)标记需要清理的数据块,即_vm结尾的文件
- VM文件使用二进制位图标识需要清理的数据块