一. 简述:
ClickHouse 是一款高性能列式存储数据库,专为海量数据的实时分析场景设计。它以极致的查询速度、高效的存储利用率和强大的并行处理能力著称,广泛应用于日志分析、用户行为分析、业务监控等大数据分析领域。
1. 核心特性:
a). 列式存储:传统行式数据库(如 MySQL)按行存储数据,适合增删改查;ClickHouse 按列存储,同一列数据连续存放,可大幅减少 IO 量(仅读取查询所需列),且相同类型数据压缩率更高(通常比行式存储高 5-10 倍)。
b). 高效的查询性能:基于向量执行引擎,单次处理一批数据(而非单条),减少函数调用开销;查询会被拆分为多个子任务,在多个 CPU 核心上并行执行;内置大量优化的数学、字符串等函数,支持复杂计算高效执行。
c). 支持实时写入更新:提供 INSERT 语句支持高吞吐写入(每秒数十万条),数据写入后立即可见。
d). 丰富的表引擎:表引擎决定数据存储方式、索引策略和查询特性,核心引擎包括:
-
MergeTree:常用引擎,支持分区、排序、TTL、副本和分片,适合海量历史数据存储。 -
ReplacingMergeTree:在合并分区时自动去重,适合处理重复数据。 -
SummingMergeTree:合并时自动聚合数据,适合预计算场景。 -
Memory:内存表,查询极快但数据不持久,适合临时计算。
2. 分布式架构支持:
原生支持集群部署,通过分片(数据拆分到不同节点)和副本(数据冗余备

最低0.47元/天 解锁文章
174

被折叠的 条评论
为什么被折叠?



