ClickHouse深入浅出之(一) 基础篇

1. 需求背景 

1.1. 概述

       随着数据科技的进步,数据分析师早已不再满足于传统的T+1式报表或需要提前设置好维度与指标的OLAP查询。数据分析师更希望使用可以支持任意指标、任意维度并秒级给出反馈的大数据Ad-hoc查询系统。这对大数据技术来说是一项非常大的挑战,传统的大数据查询引擎根本无法做到这一点。由俄罗斯的Yandex公司开源的ClickHouse脱颖而出。在第一届易观OLAP大赛中,在用户行为分析转化漏斗场景里,ClickHouseSpark快了近10倍。在随后几年的大赛中,面对各类新的大数据引擎的挑战,ClickHouse一直稳稳地坐在冠军宝座上。同时在各种OLAP查询引擎评测中,ClickHouse单表查询的速度力压现在流行的各大数据库引擎,尤其是Ad-hoc查询速度一直遥遥领先,因此被国内大量用户和爱好者广泛用在即席查询场景当中。

ClickHouse的性能测试:https://clickhouse.tech/benchmark/dbms/

1.2. 用户轨迹行为分析

  架构目标:

  1. 海量数据
  2. 实时导入
  3. 实时查询
  4. 多维聚合分析

1.3. 架构分析

  1. 数据的实效性:中间过程经过KafkaETL、调度处理,报表的实效性不理想
  2. 即席分析性能:Hive存储是hdfs文件系统,查询效率不高,不适合即席查询
  3. 涉及Hadoop组件多:涉及FlumeKafkaHDFS等等,数据冗余过多,同时需要深厚的知识储备
  4. 数据链路长:数据链路处理流程长,繁琐容错也不好

1.4. 美好愿望

2. OLAP详解

OLTP + OLAP Ttransaction 事务处理 侧重于增删改  A analysis 分析 Select大批量数据的聚合查询事务处理作用:保证数据的一致性,如果涉及到事务操作,这个操作的执行效率必然不高

OLAP + OLTP =====> 同时满足,很难涉及

MySQL insert update delete Hive ClickHouse:   Select 查询分析的高效

读模式 +

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值