hive、impala、prestoDB 优缺点对比

本文对比了Hive, Impala和PrestoDB这三种大数据处理工具的特点。Hive的优点在于其广泛应用性和良好的用户自定义函数支持,但查询速度较慢;Impala提供轻量级快速查询,但在节点查询失败时容忍度为零;PrestoDB同样轻量快速,但不支持用户自定义函数。这些工具在不同场景下各有优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • hive
优点缺点
被广泛应用,经受时间的考验既然是基于Mapreduce,也拥有MapReduce所有缺点,包含昂贵的Shuffle操作和磁盘IO操作
运行在Mapreduce框架之上hive仍然不支持多个reduce操作group by和order by查询
非常好的支持用户自定义函数和其他竞品相比,查询速度很慢
很友好的和hbase等系统结合
  • cloudera impala
优点缺点
轻量快速,支持近乎实时的查询零容忍运行查询任务,如果一个节点上查询失败,整个查询都会失败
计算都在内存中完成,减少延迟和磁盘IO开销用户自定义函数不是很好的支持
  • PrestoDB
优点缺点
轻量快速,支持近乎实时的查询13年的new born,需要待验证
facebook内部广泛使用,扩展性和稳定性毋庸置疑现在支持hive管理的表,尽管官方称支持hbase查询,但是仍然是开发状态
自从开源依赖有强劲的发展势头不支持UDF操作
和impala同样使用分布式查询引擎,和传统的Mapreduce相比,消除了延迟和磁盘IO开销
文档完善
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值