Doris 写入流程列存储分区分桶读取流程向量化引擎

最新推荐文章于 2025-08-30 03:37:24 发布

原创

最新推荐文章于 2025-08-30 03:37:24 发布 · 979 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

Doris 是一个 MPP（大规模并行处理）分析型数据库，通常用于实时分析场景。它结合了列式存储、向量化查询引擎等技术来提供高性能的查询能力。下面我将简单介绍 Doris 的写入流程、列存储、分区分桶规划，以及读取流程和向量化引擎的调用。

写入流程

数据接收：客户端将数据发送到 Doris 的 BE（Backend）节点。
数据解析：BE 节点对接收到的数据进行解析，转换成 Doris 内部的数据格式。
数据预处理：可能包括数据清洗、类型转换等操作。
数据写入：数据被写入到相应的存储引擎中。Doris 使用的是列式存储。
数据合并：为了保持数据的有序性，Doris 会进行数据的合并操作。
写入完成：数据写入完成，客户端收到写入成功的反馈。

列存储

Doris 采用列式存储，这与传统的行式存储不同。在列式存储中，相同类型的数据被存储在一起，这样可以更有效地进行数据的压缩和编码，从而提高查询性能。此外，列式存储也更适合进行向量化的查询操作。

分区分桶规划

分区：Doris 支持表的分区功能，可以根据业务需求将数据按照某个字段进行分区。例如，可以按照日期字段进行分区，每天一个分区。这样查询时就可以只扫描相关的分区，提高查询效率。
分桶：分桶是将数据在物理存储层面上进行分散存储的一种方式。Doris 支持对表进行分桶操作，通常是根据某个字段的哈希值进行分桶。分桶有助于数据的均衡分布，避免数据热点，提高并发查询能力。

读取流程

查询解析

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。