分布式DB：计算下推

原创已于 2025-05-31 09:59:20 修改 · 1.1k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#分布式 #数据库

于 2025-05-31 09:58:52 首次发布

DBA 专栏收录该内容

1069 篇文章

订阅专栏

目录标题

数据库计算下推机制对比
计算下推解释
计算下推在DB中的实现

数据库计算下推机制对比

计算下推是数据库优化的重要手段，将上层计算逻辑下沉到存储层执行，减少数据传输和计算开销。
TiDB：采用SQL与存储分离架构，支持WHERE过滤、列投影和简单聚合下推，通过减少网络传输提升性能。
OceanBase：得益于SQL与存储融合设计，下推效率更高，支持过滤、聚合、JOIN等复杂操作的下推，并在多分片上并行执行。
GaussDB：采用计算与存储解耦的CN+DN架构，通过MPP框架实现分布式下推计算，支持两阶段聚合和部分表达式下推。
三者在架构设计、下推支持范围和执行框架上各有特点：

TiDB逐步增强复杂查询下推
OceanBase融合架构下推效率最高
GaussDB通过MPP实现大规模并行下推

如需具体场景分析，可进一步探讨执行计划示例。

计算下推解释

计算下推简单解释下：

✅ 什么是计算下推？

“计算下推”就是把 本来应该在上层数据库（SQL 层）做的计算，**下放到存储层（TiKV）**去做。

📦 举个例子：

假设你有个表 user，你写了个 SQL：

SELECT name FROM user WHERE age > 30;

没有下推的情况：

SQL 层（TiDB Server）发出请求，把所有数据拉到自己这里。
然后自己筛选 age > 30。
再投影出 name 字段。

➡️ 代价： 拉了很多无用数据，浪费网络和内存。

有下推的情况：

TiDB 把 WHERE age > 30 和 SELECT name 的信息告诉 TiKV。
TiKV 在本地先过滤 + 只返回 name 字段。
SQL 层只负责结果拼装。

➡️ 优点： 少传数据，计算更快，集群资源用得更合理。

💡 哪些操作能下推？

WHERE 条件（过滤）
SELECT 字段（列投影）
简单的表达式（比如 a + 1）
有些聚合函数（如 COUNT, SUM，部分条件下）

⚠️ 但不是所有都能下推！

有些复杂的函数、UDF、部分 JOIN 类型等还不能（或不适合）下推，还得在 SQL 层搞定。

如果你对某种 SQL 或操作是否能下推想测试一下，我可以帮你分析下能不能。也可以告诉你 用 EXPLAIN 看执行计划 的方法。需要我演示一下吗？

计算下推在DB中的实现

非常好问题！你已经掌握了 TiDB 的计算下推机制，接下来我们对比一下 OceanBase（OB） 和 GaussDB 是如何做“计算下推”的（特别是在分布式环境下），这是判断系统优化能力的重要指标。

🔷 OceanBase（OB）的计算下推机制

🌟 总体思路：

OceanBase 采用 融合引擎 架构，即 SQL 层与存储引擎为“强耦合”设计，这为计算下推提供了天然优势，许多操作可以直接在存储层做，减少 RPC 调用次数。

✅ 支持下推的内容：

下推类型	支持情况
过滤（WHERE）	✅ 强支持
列投影（SELECT）	✅ 支持
聚合函数	✅ 支持 COUNT、SUM、AVG 等
表连接（JOIN）	✅ 对小表广播/Hash Join 下推
子查询/表达式	✅ 支持部分表达式下推

🔧 优势：

高效： 由于 SQL 引擎和存储引擎融合在一个进程中（同一个租户下），内存访问效率远高于进程间 RPC。
写优化型引擎下的分布式执行计划支持： 通过任务调度，计算逻辑可在多数据分片上并发下推执行。
并行执行： OceanBase 会尽可能并发 push down 操作，提升计算吞吐。

📌 示例：

SELECT avg(salary) FROM employee WHERE dept_id = 10;

会将 WHERE dept_id=10 和 AVG(salary) 的逻辑推到存储层，由各分片做局部聚合，最终在 Root Server 做汇总。

📚 参考文档：

OceanBase 执行计划官方说明

🔷 GaussDB（华为）

GaussDB 其实有两个路线，我们主要讲的是GaussDB(for openGauss) 的场景，也可以适用于其分布式版本 GaussDB(for MySQL) 的思想。

🌟 总体思路：

GaussDB 分布式场景中采用 计算与存储解耦 的架构（CN + DN 模式，计算节点与数据节点分离），通过 下推计算逻辑到数据节点（DN） 来提升性能。

✅ 支持下推的内容：

下推类型	支持情况
WHERE 过滤	✅ 支持
列投影	✅ 支持
聚合函数	✅ 支持 GROUP BY、COUNT、SUM 等常用聚合
JOIN	⚠️ 主要以 Broadcast/Shuffle 的方式执行，视场景是否下推
函数表达式	✅ 标量表达式下推，部分 UDF 支持

🔧 技术细节：

MPP（大规模并行处理）框架支持： 查询会被划分为多个执行阶段，下推到多个 DN 上并行处理。
两阶段聚合下推： GROUP BY / SUM 先在数据节点做局部聚合，计算节点再做最终聚合。
下推策略可调： 开发者可配置是否启用某些下推策略，如算子并行度、连接算法优先级等。

📚 参考文档：

openGauss 执行计划与下推机制

🔄 小结对比：TiDB vs OB vs GaussDB

功能	TiDB	OceanBase	GaussDB
架构模式	SQL层+存储分离	SQL存储融合	计算/存储解耦（CN+DN）
WHERE/投影下推	✅ 支持	✅ 支持	✅ 支持
聚合函数下推	✅ 局部聚合	✅ 强聚合（Local + Global）	✅ 两阶段聚合
JOIN 下推	⚠️ 复杂，部分支持	✅ 广播小表可下推	⚠️ 部分支持
子查询/表达式下推	✅ 逐步增强中	✅ 更全面支持	✅ 常见表达式可下推
执行框架	Volcano Pipeline（8.0起）	Task并行模型	MPP（并行处理框架）