目录
什么是 ClickHouse
软件介绍
简介
- 1、ClickHouse 是俄罗斯搜索巨头 Yandex 公司早 2016年 开源的一个极具 " 战斗力 " 的实时数据分析数据库,开发语言为C++
- 2、是一个用于联机分析 (
OLAP:Online Analytical Processing) 的列式数据库管理系统(DBMS:Database Management System),简称 CK - 3、工作速度比传统方法快100-1000倍,ClickHouse 的性能超过了目前市场上可比的面向列的DBMS。 每秒钟每台服务器每秒处理数亿至十亿多行和数十千兆字节的数据。
市场环境
- 1、随着业务的迅猛增长,Yandex.Metrica目前已经成为世界第三大Web流量分析平台,每天处理超过200亿个跟踪事件。能够拥有如此惊人的体量,在它背后提供支撑的ClickHouse功不可没。
- 2、ClickHouse已经为Yandex.Metrica存储了超过20万亿行的数据,90%的自定义查询能够在1秒内返回,其集群规模也超过了400台服务器。虽然ClickHouse起初只是为了Yandex.Metrica而研发的,但由于它出众的性能,目前也被广泛应用于Yandex内部其他数十个产品上。
目前国内社区火热,各个大厂纷纷跟进大规模使用:
- 今日头条 内部用ClickHouse来做用户行为分析,内部一共几千个ClickHouse节点,单集群最大1200节点,总数据量几十PB,日增原始数据300TB左右。
- 腾讯 内部用ClickHouse做游戏数据分析,并且为之建立了一整套监控运维体系。
- 携程 内部从18年7月份开始接入试用,目前80%的业务都跑在ClickHouse上。每天数据增量十多亿,近百万次查询请求。
- 快手 内部也在使用ClickHouse,存储总量大约10PB, 每天新增200TB, 90%查询小于3S。
特点
1、开源的列存储数据库管理系统,支持线性扩展,简单方便,高可靠性
2、容错跑分快:比Vertica快5倍,比Hive快279倍,比MySQL快800倍,其可处理的数据级别已达到10亿级别
3、功能多:支持数据统计分析各种场景,支持类SQL查询,异地复制部署
优点
1、真正的面向列的DBMS
- ClickHouse是一个DBMS,而不是一个单一的数据库。它允
许在运行时创建表和数据库、加载数据和运行查询,而无需重新配置和重新启动服务器
2、数据压缩
- 一些面向列的DBMS(INFINIDB CE 和 MonetDB)不使用数据压缩。但是,数据压缩确实是提高了性能

本文详细介绍ClickHouse,一款由Yandex开源的高性能OLAP数据库,以其列式存储、并行处理、实时更新和大规模应用案例为焦点,探讨其优缺点和实战部署。
最低0.47元/天 解锁文章
685

被折叠的 条评论
为什么被折叠?



