分布式mysql使用什么引擎_「分布式技术专题」三种常见的数据库查询引擎执行模型...

最新推荐文章于 2024-06-25 14:39:46 发布

原创最新推荐文章于 2024-06-25 14:39:46 发布 · 157 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#分布式mysql使用什么引擎

本文介绍了三种常见的数据库查询引擎执行模型：火山模型，以其简单但效率较低的特点被广泛应用于SQLite、MongoDB等数据库；物化模型，适合处理OLTP查询，一次性处理所有输入并输出结果；以及向量化模型，结合了火山模型和物化模型的优点，减少函数调用次数，适合OLAP查询，如在Presto和SQLServer中使用。

一、迭代模型/火山模型(Iterator Model)

又称 Volcano Model 或者 Pipeline Model。

e08dd77acfed

Iterator Model

该计算模型将关系代数中每一种操作抽象为一个 Operator，将整个 SQL 构建成一个 Operator 树，查询树自顶向下的调用next()接口，数据则自底向上的被拉取处理。

火山模型的这种处理方式也称为拉取执行模型(Pull Based)。

大多数关系型数据库都是使用迭代模型的，如 SQLite、MongoDB、Impala、DB2、SQLServer、Greenplum、PostgreSQL、Oracle、MySQL 等。

火山模型的优点在于：简单，每个 Operator 可以单独实现逻辑。

火山模型的缺点：查询树调用next()接口次数太多，并且一次只取一条数据，CPU 执行效率低；而 Joins, Subqueries, Order By 等操作经常会阻塞。

二、物化模型(Materialization Model)

e08dd77acfed

Materialization Model

物化模型的处理方式是：每个 operator 一次处理所有的输入，处理完之后将所有结果一次性输出。

物化模型更适合OLTP负载，这些查询每次只访问小规模的数据，只需要少量的函数调用。

三、向量化/批处理模型(Vectorized / Batch Model)

Batch Model

向量化模型和火山模型类似，每个 operator 需要实现一个 next() 函数，但是每次调用 next() 函数会返回一批的元组(tuples)，而不是一个元组，所以向量化模型也可称为批处理模型。

向量化模型是火山模型和物化模型的折衷。

向量化模型比较适合 OLAP 查询，因为其大大减少了每个 operator 的调用次数，也就简单减少了虚函数的调用。

Presto、snowflake、SQLServer、Amazon Redshift等数据库支持这种处理模式。

Spark 2.x 的 SQL 引擎开始也支持向量化执行模型。

在 Hive 中使用向量化执行的方式：1、必须以 ORC 格式来存储数据，2、将 hive.vectorized.execution.enabled 参数设置为 true

以上为三种常见的数据库查询引擎执行模型，「分布式技术专题」是国产数据库hubble团队精心整编，专题会持续更新，欢迎大家保持关注。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。