ClickHouse单机和分片集群安装与特点介绍

本文介绍了ClickHouse,一个用于在线分析处理查询的列式存储数据库,强调其列式储存、高吞吐量、数据易维护等特性。尽管不适合复杂业务的多表JOIN,但ClickHouse支持标准SQL语法,提供多样化引擎,以及高效率的数据写入。文章还涵盖了ClickHouse的安装步骤、数据分区与线程级并行查询,以及分片集群的部署策略,包括创建集群表和总表的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  •  介绍

ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),使用C++语言编写,主要用于在线分析处理查询(OLAP)
适合单条sql的查询  多表join能力较差

  •  特点

 列式储存 

 对应列的聚合,计算,求和速度优于行式储存 
 又于列的数据类型相同 可以使用更加高效的压缩方式 
 数据压缩的更好 一方面节约磁盘空间 另一方面对cache(高速缓存器)有更大     的发挥空间 
 吞吐量高、性能强,一致性、事务性较弱
 数据易维护,当我们更新数据时,历史数据会有版本号,不会被改变或者消失。
 缺点也很明显。列式存储在表关联上不方便 适合数据分析 不适合复杂业务 


 DBMS功能 

 


完成了标准的SQL语法 DDL ,DML含有大量函数(不支持自定义函数) 用户管理好权限管理,含有数据备份和恢复


多样化引擎


多种引擎 适应不同的业务场景 20多种  合并树,日志 ,接口,等等 


 高吞吐写入


ClickHouse采用类LSM Tree的结构,数据写入后定期在后台Compaction。
ckHouse在数据导入时全部是顺序append写 compaction时也是多个段merge sort后顺序写回磁盘
官方公开benchmark测试显示能够达到50MB-200MB/s的写入吞吐能力,按照每行10

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值