分布式查询 presto 入门安装使用

为提高数据分析效率,本文介绍了一款由Facebook开源的分布式内存计算框架Presto。相较于依赖MapReduce的Hive,Presto直接在内存中进行计算,大幅提升了查询速度。它支持标准SQL语法,便于SQL开发者快速上手。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

[url]http://my.oschina.net/chengxiaoyuan/blog/700263[/url]
为了分析海量数据,需要寻找一款分布式计算的开源项目,以前用的比较多的是hive,但是由于hive任务最终会被解析成MR任务,MR从硬盘读取数据并把中间结果写进硬盘,速度很慢,所以要寻找一款基于内存计算的开源项目,presto是Facebook开源的,基于内存的分布式计算框架。

Presto优点

1. 基于标准的ANSI SQL,有sql基础的都能快速使用

2. 安装部署简单

3. 基于内存计算,不要依赖MR,速度比hive快很多,。

[size=x-large][color=red]详细看原文[/color][/size]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值