presto调研和json解析函数的使用

本文介绍了Presto作为一个高效的SQL交互式查询引擎,其查询速度可达Hive的5-10倍,尤其适合单表查询。文章探讨了Presto与Hive的适用场景区别,指出Presto不适合作为ETL工具或处理大表关联查询。此外,还详细讲解了在Presto中如何进行JSON解析,展示了与Hive不同的处理方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

presto简单介绍

          presto是一个分布式的sql交互式查询引擎。可以达到hive查询效率的5到10倍。支持多种数据源的秒级查询。

          presto是基于内存查询的,这也是它为什么查询快的原因。除了基于内存,presto还使用了

    • 向量计算,
    • 动态编译执⾏计划
    • 优化的ORC和Parquet Reader技术

          从而优化查询的速度。

    1. presto和hive的对比
      hive和presto是针对不同使用场景的。presto虽然查询很快,但是也不是适用于所有的查询场景。
      比如做多张大表的关联查询,
      由于presto是基于内存查询的。做大表关联查询时,数据要加载到内存中,假如使用presto查询超过了几分钟才会有返回。
      且严重影响集群的性能。这就违背了presto交互式查询的初衷,交互式就是要做到近实时查询与返回。
      所以,presto不适合做多张大表的join操作或者ETL操作。这种情况就该使用hive了。
      另外,hive只能做hdfs查询(es等需要插件支持),而presto支持了mysql,pg,kafka,redis等。
      总之,presto是支持多数据源的查询利器。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值