表结构优化
表引擎
clickhouse中有非常多的表引擎,用得最多的当属*MergeTree
表引擎,*MergeTree
是clickhouse中最为强大的表引擎(the most robust)。应根据应用场景选择不用的表引擎比如我们临时表用的表引擎为Memory
,这里主要谈谈MergeTree
中的一些优化。
官网中列出了MergeTree的四点特性:
- 数据根据主键排序存储;
- 可通过指定partitioning key确定分区;
- 支持数据备份;
- 支持数据抽样。
MergeTree表引擎的数据由多组part组成,每一个part的数据按照主键进行字典序排列,然后定期在后台进行数据合并。分区和数据合并详情可参考