什么是ClickHouse? | ClickHouse Docs
本篇不属于安装使用,限于入门理论了解
开源列式数据库,主要用于数据分析(OLAP)。那么clickhouse的主要使用场景、特点以及核心概念有哪些?
自己理解:轻量级大数据仓库
场景
读多于写:适用于大量数据的分析、查询。优势不在于写和更新。
大宽表,读大量行但是少量列,结果集较小:相对于行存储字段很多,但是查询返回几个字段的情况
数据批量写入,且数据不更新或少更新:海量数据快速导入(历史数据尽量不动)
无需事务:支持不?
列式存储
既然是列示数据库,那么列式存储的优势当然要了解
相比于行式存储,列式存储在分析场景下有着许多优良的特性。
1、上面也提到的大宽表的场景(基于数据库的存储原理,说实在的不是很懂,这里作为知识点)
大概就是行存储,因为所有列的数据是统一存储,即使不用,实际查询还是查了,如果需要的列很少,效率存在浪费。
分析场景中往往需要读大量行但是少数几个列。在行存模式下,数据按行连续存储,所有列的数据都存储在一个block中,不参与计算的列在IO时也要全部读出,读取操作被严重放大。而列存模式下,只需要读取参与计算的列即可,极大的减低了IO cost,加速了查询。

ClickHouse是一个开源列式数据库,主要用于在线分析处理(OLAP)。其特点是适合读多于写的情景,处理大宽表,数据批量写入且不常更新。列式存储在分析场景下提供高效能,包括降低存储成本、提高I/O效率和压缩效果。ClickHouse还支持高吞吐的写入能力和分布式集群模式。
最低0.47元/天 解锁文章
7463

被折叠的 条评论
为什么被折叠?



