一. 简介
列式分布式,支持实时分析,PB级数据,毫秒级查询,数据实时处理
预计算预聚合
bitmap压缩算法
必须具备时间字段
1. 特点
2. 应用场景
- 多读写少
- 实时性要求高
- 数据质量不敏感
二. 核心
1. Druid 与Impala,Kylin,Presto,Impala,Spark SQL,ES的对比
2. 大数据分析框架选型
3. Druid架构原理
4. Nodes
MiddleManager Nodes
Historical Nodes
Coordinator Nodes
Overload Nodes
Broker Nodes
Metadata Storage
Zookeeper
5. LSM Tree
6. 数据结构
DataSource + Segment
DataSource: 时间列/维度列/指标列
Segment: 数据块 (数据横向切割/数据纵向切割 )
7. Druid安装
imply 安装Druid
webui: 9095