Clickhouse 入门到精通-Clickhouse工作原理

原创

已于 2023-05-19 16:55:40 修改 · 1.9k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2023-05-19 16:54:28 首次发布

Clickhouse 为什么做查询分析那么快？？？？？？？？

因为clickhouse使用了下列方案：

clickhouse 数据分区
clickhouse 列式存储
clickhouse 一级索引（主键索引）
clickhouse 二级索引（跳数索引）
clickhouse 数据压缩
clickhouse 数据标记

结合两个需求场景来解析

数据插入
数据查询

1、clickhouse数据分区

关于表分区目录结构：MergeTree表的分区目录物理结构：

假设有一个分区表：该表有 a,b,date,name四个字段，其中date是分区字段（按月份）

那么对于分区有两个问题：

分区文件夹的命名规则是什么？合并规则是什么？
分区文件夹中国的文件列表，各是什么作用，什么含义？

1.1命名规则 & 合并规则

PartitionID_MinBlockNum_MaxBlockNum_level，示例：20230519_1_1_0

PartitionID:分区字段的值

MinBlockNum:最小块序号

MaxBlockNum:最大块序号

Level:参与合并的次数

BlockNum是表内部全局累加,每次创建一个新的分区目录，就会累加 1

文件目录的变化过程

-- 假设有两条语句
A: insert into table values ('2021-06', 'a'), ('2021-07', 'b');
B: insert into table values ('2021-06', 'c'), ('2021-07', 'd');

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。