背景
Elasticsearch是一个强大的分布式全文检索和数据分析引擎,也是日志分析系统经常使用的一种实现方案,但近年来随着ClickHouse的发展,Elasticsearch在日志分析领域的地位逐渐被取代,许多公司已经将自己的日志分析解决方案从ES迁移到了ClickHouse,比如阿里、bilibili、快手等公司,公司内部有一些团队的数据分析业务也从ES迁移到了ClickHouse。为什么ClickHouse会受到越来越多人的青睐?它与ES相比有什么过人之处?
ClickHouse是俄罗斯搜索巨头Yandex公司于2016年开源的一个列式数据库管理系统,是面向列式存储的关系型数据库,这两年来Clickhouse凭借其极致的性能,成为OLAP领域的后起之秀,发展速度非常快。下面将从数据存储成本、数据写入吞吐量、数据查询速度三个方面详细分析ClickHouse的优势。
数据存储成本
传统的关系型数据库都是面向行存储,而ClickHouse是面向列存储。列式存储有什么优势呢?
行式存储
行式存储在物理上是逐行存储的,每行的数据在物理上是连续的。
列式存储
列式存储在物理上是逐列存储的,每列的数据在物理上是连续的,ClickHouse每列的数据存储在一个单独的文件中。
列式存储为什么能够降低数据的存储成本呢?因为列式存储更有利于数据的压缩。Cl