一. 简介
GB/PB 秒级
OLAP
MOLAP: 多维联机分析处理(MOLAP)
ROLAP: 关系型联机分析处理(ROLAP)
MOLAP可选Kylin、Druid,
ROLAP可选Presto、impala等
Hive/Redis/Kafka
1. 与Impala的对比
性能:impala 性能更好
数据源支持: presto 更加丰富
2. 优缺势
-
内存运算
-
连接多个数据源,跨数据源连表查询
-
不适合链表查询,尽量避免join,可以用宽表解决
二. 核心
1. 优化
存储
列存储: ORC,比Parquet好
压缩: Snappy
查询
2. webui
7080
三. 其他
1. 学习
https://www.bilibili.com/video/BV1cE411179N?p=6&spm_id_from=pageDriver