大数据分析篇之Druid

本文介绍了Druid,一个列式分布式的大数据分析系统,具备实时分析、PB级数据处理能力及毫秒级查询响应。它使用预计算预聚合和bitmap压缩算法,并强调了其在多读写少、实时性要求高、数据质量不敏感场景的应用。文章还对比了Druid与其他大数据框架如Impala、Kylin等,并详细阐述了Druid的节点架构、LSM Tree数据结构及安装步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一. 简介

列式分布式,支持实时分析,PB级数据,毫秒级查询,数据实时处理
预计算预聚合
bitmap压缩算法

必须具备时间字段

1. 特点

2. 应用场景

  1. 多读写少
  2. 实时性要求高
  3. 数据质量不敏感

二. 核心

1. Druid 与Impala,Kylin,Presto,Impala,Spark SQL,ES的对比

2. 大数据分析框架选型

3. Druid架构原理

4. Nodes

MiddleManager Nodes
Historical Nodes
Coordinator Nodes
Overload Nodes
Broker Nodes

Metadata Storage
Zookeeper

5. LSM Tree

6. 数据结构

DataSource + Segment
DataSource: 时间列/维度列/指标列
Segment: 数据块 (数据横向切割/数据纵向切割 )

7. Druid安装

imply 安装Druid
webui: 9095

三. 其他

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Freedom3568

技术域不存在英雄主义,不进则退

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值