PostgreSQL 12 的 CBO(基于代价的优化器,Cost-Based Optimizer)是其查询优化的核心组件,用于生成高效的查询执行计划。PostgreSQL 的 CBO 通过估算各种执行路径的代价,选择最优的路径来执行 SQL 查询。
PostgreSQL 12 CBO 的主要特点
-
基于代价的优化:
PostgreSQL 的 CBO 通过计算不同执行计划的代价来决定查询的执行方式。这种代价模型会考虑 CPU、I/O、内存消耗,并基于这些资源估算每种查询执行方案的成本,选择成本最低的方案。 -
丰富的统计信息支持:
CBO 依赖于数据库的统计信息来估算查询的代价,PostgreSQL 12 中的ANALYZE
命令可以收集表、列和索引的统计信息,帮助优化器做出更准确的决策。 -
复杂查询优化:
PostgreSQL 12 CBO 能处理复杂的 SQL 查询,包括:- 多表连接查询(Joins)
- 子查询、CTE(公用表表达式)
- 聚合查询
- 窗口函数等
-
增量分析:
PostgreSQL 12 引入了一些新的查询优化功能,包括增量统计分析,通过结合更准确的列统计,特别是在多列有复杂依赖关系时,能生成更高效的执行计划。
PostgreSQL 12 CBO 的工作流程
1. 查询解析与重写
当 PostgreSQL 收到一个 SQL 查询时,它首先会将查询解析为语法树。之后,查询优化器会对这个语法树进行查询重写,比如将子查询转化为 JOIN 或者合并一些可以简化的操作。
2. 生成候选执行计划
PostgreSQL 的 CBO 会根据查询的结构,生成一系列的候选执行计划。对于一个简单的查询,可能有多种执行方式可供选择,比如:
- 顺序扫描(Sequential Scan):依次扫描整个表。
- 索引扫描(Index Scan):通过索引来定位特定的行。
- 哈希连接(Hash Join):对于表连接,使用哈希连接来减少计算