001_ClickHouse入门

ClickHouse入门
 
本小记学习目标
  1. ClickHouse简介
  2. 如何安装ClickHouse
 
一、ClickHouse简介
对ClickHouse的认识:它一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。
传统的DBMS是行式的,一行数据代表一个逻辑的实体,常见的行式DBMS有:MySQL、SqlServer、Oracle ……
列式数据库系统中,数据是按一列一列的存储的,也可以理解为每一列可以看作为一个逻辑的实体。常见的列式数据库有: Vertica、 Paraccel (Actian Matrix,Amazon Redshift)、 Sybase IQ、 Exasol、 Infobright、 InfiniDB、 MonetDB (VectorWise, Actian Vector)、 LucidDB、 SAP HANA、 Google Dremel、 Google PowerDrill、 Druid、 kdb+
不同的数据存储方式适用于不同的业务场景,不能说列式存储就优于行式存储,需要根据实际的场景来确实如何对数据进行存储。
OLAP场景下有如下一些特征:
  • 大部分为读取操作
  • 一般对数据是做批量更新而非单行更新
  • 已写入数据库中的数据不可以修改
  • 每个表包含很多列(宽表),以保存查询是可以覆盖到更多的情况而不需要多表关联
  • 查询相对较少
  • 列中的数据相对较小
  • 处理单个查询时需要高吞吐量(数十亿行每秒)
  • 不考虑事务问题
  • 对数据一致性要求不苛刻
  • 每个查询有一个大表。其他的都是小表
  • 查询结果明显小于源数据
列式数据库更加适合于OLAP场景
  • I/O方面:对于分析查询,只需要读取表的一小部分数据,列式数据库中可以只读取需要的数据,从而可以减少I/O消耗;按列存储容易压缩,进一步降低I/O;
  • CPU方面: 由于执行一个查询需要处理大量的行,因此在整个向量上执行所有操作将比在每一行上执行所有操作更加高效。同时这将有助于实现一个几乎没有调用成本的查询引擎。如果你不这样做,使用任何一个机械硬盘,查询引擎都不可避免的停止CPU进行等待。所以,在数据按列存储并且按列执行是很有意义的。
 
二、ClickHouse的安装
系统要求: ClickHouse可以在任何具有x86_64,AArch64或PowerPC64LE CPU架构的Linux,FreeBSD或Mac OS X上运行
在CentOS下,使用RPM安装
  1. 添加官方存储库
         sudo yum install yum-utils
    sudo yum-config-manager --add-repo https://repo.clickhouse.tech/rpm/stable/x86_64
  1. 运行如下命令进行安装
    sudo yum install clickhouse-server clickhouse-client
 
安装完成后可以通过如下方式启动服务:
    启动服务: /etc/init.d/clickhouse-server start        service clickhouse-server start
    
    
    启动客户端:clickhouse-client
    
    输入语句:select 1+1
    
 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值