

一、Presto
1、简介
概念:大数据量、秒级、分布式SQL查询engine【解析SQL但不是数据库】
架构

不同worker对应不同的数据源(各数据源有对应的connector连接适配器)
优缺点

缺点:读数据连查表会产生大量临时数据
与impala比较
Impala性能稍领先于Presto,但是Presto在数据源支持上非常丰富,如redis
2、安装
server安装
配置一个Hive的catalog
在hadoop102上配置成coordinator,在hadoop103、hadoop104上配置为worker
clien

本文探讨了大数据分析引擎Presto的安装、优化,快速分析系统Druid的原理和使用,以及分布式OLAP引擎Kylin的建模与性能提升。介绍了如何通过这些工具处理PB级数据,实现秒级查询和实时分析。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



