Clickhouse 入门到精通-Clickhouse工作原理

Clickhouse 为什么做查询分析那么快????????

因为clickhouse使用了下列方案:

  1. clickhouse 数据分区
  2. clickhouse 列式存储
  3. clickhouse 一级索引(主键索引)
  4. clickhouse 二级索引(跳数索引)
  5. clickhouse 数据压缩
  6. clickhouse 数据标记

 结合两个需求场景来解析

  • 数据插入
  • 数据查询

1、clickhouse数据分区

关于表分区目录结构:MergeTree表的分区目录物理结构:

假设有一个分区表:该表有 a,b,date,name四个字段,其中date是分区字段(按月份)

那么对于分区有两个问题:

  • 分区文件夹的命名规则是什么?合并规则是什么?
  • 分区文件夹中国的文件列表,各是什么作用,什么含义?

 1.1命名规则 & 合并规则

PartitionID_MinBlockNum_MaxBlockNum_level,示例:20230519_1_1_0

PartitionID:分区字段的值

MinBlockNum:最小块序号

MaxBlockNum:最大块序号

Level:参与合并的次数

BlockNum是表内部全局累加,每次创建一个新的分区目录,就会累加 1

文件目录的变化过程

-- 假设有两条语句
A: insert into table values ('2021-06', 'a'), ('2021-07', 'b');
B: insert into table values ('2021-06', 'c'), ('2021-07', 'd');
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值