Clickhouse实时数仓建设

本文介绍了Clickhouse在在线分析处理(OLAP)场景中的应用,探讨了它为何适合此类场景,以及在实时数仓构建中的优点和挑战。作者还对比了Hadoop生态,指出Clickhouse在效率和生态建设方面的优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.概述

Clickhouse是一个开源的列式存储数据库,其主要场景用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告。今天,笔者就为大家介绍如何使用Clickhouse来构建实时数仓,来满足一些实时性要求较高的使用场景。

2.内容

2.1 什么是OLAP场景

在介绍Clickhouse构建实时数仓之前,我们先来了解一下OLAP的使用场景,通常OLAP的使用场景包含如下特征:

  • 绝大多数是读取请求;
  • 数据以相当大的Batch进行更新;
  • 已存储的数据不能随意修改;
  • 对于读取,从数据存储中提取相当多的行,但是只提取列的一小部分;
  • 大宽表,即每个表包含着大量的列;
  • 查询相对较少(QPS很小);
  • 对于简单查询,允许有较低的延迟,比如50ms~100ms;
  • 列中的数据相对较小,比如字符串长度很短;
  • 处理单个查询时需要高吞吐量;
  • 事务非必须;
  • 对数据一致性要求低;
  • 每一个查询有一个大表,除了它其他都是很小的;
  • 查询结果明显小于源数据。

通过观察这些特征,我们可以看出,对于OLAP场景与其他业务场景(比如OLTP、KV等)有所不同,因此想要使用OLTP或者KV来高效的处理数据分析查询场景,并不是非常完美的解决方案。

2.2 Clickhouse更适合OLAP的原因

Clickhouse更适合OLAP场景&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序猿小乙

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值