Impala在处理结果集较大的查询的优势

最新推荐文章于 2022-06-13 18:21:40 发布

weixin_34059951

最新推荐文章于 2022-06-13 18:21:40 发布

阅读量319

点赞数

CC 4.0 BY-SA版权

文章标签：数据库 python 前端 ViewUI

原文链接：http://blog.51cto.com/quenlang/1747304

本文通过实际案例对比了Impala与MySQL在处理大规模数据集时的性能表现。实验结果显示，在处理15年数据量的情况下，Impala相较于MySQL展现出了更高的效率和更好的稳定性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

近期运营出报表，查询的数据量为15年的数据量，涉及的表及表中记录数如下图所示：

刚开始的时候在MySQL中进行查询汇总，选择第一个数据量最小的表，发现MySQL 出现内存溢出，数据库使用的是腾讯云上的一台CDB，内存大小为24GB。后来将数据上传到hdfs上使用impala（数据格式为PARQUET）来查询，发现效果要好于MySQL，我们的impala是一个3节点集群，内存8GB，存储500GB SSD。查询耗时如下：

从查询的过程可以看出，impala在处理较大的数据集时有着MySQL所不具备的高性能。如果在MySQL中对5亿条记录做汇总，可能需要很高的配置了，而且运行时间不见得比impala短。

转载于:https://blog.51cto.com/quenlang/1747304

weixin_34059951

博客等级

码龄9年

168
原创

250
点赞

1282
收藏

3802
粉丝

关注

私信

热门文章

上一篇：: connection to dat Can't connect to local MySQL server through socket '/var/lib/mysql/mysql.s...

下一篇：: JPA 实战 OneToOne

最新评论

Parallel.ForEach 多线程声明失败 "未将对象引用设置到对象的实例"
飞舞的哈哈: 这个其实就是在并行运算中尽量不要出现对同一个变量进行初始化或者更改。举个例子，如果在多线程中出现了声明了一个变量dog（狗），然后进行实例化dog.name="二哈"（狗的名字叫二哈），对狗的名字进行更改dog.name="三哈"（狗的名字叫三哈）。假如有两个线程，其中一个线程刚到狗改名字的阶段，结果第二个线程刚声明了一个同样名称的类还没有实例化，由于两个类的名字相同，就会导致第一个线程出现这个类还没有实例化，所示不能改名字的现象（出错）。如果一定要用那就“锁住”，或者使用数组（而不是链表）的形式。
Parallel.ForEach 多线程声明失败 "未将对象引用设置到对象的实例"
飞舞的哈哈: 这个其实就是在并行运算中尽量不要出现对同一个变量进行初始化或者更改。举个例子，如果在多线程中出现了声明了一个变量dog（狗），然后进行实例化dog.name="二哈"（狗的名字叫二哈），对狗的名字进行更改dog.name="三哈"（狗的名字叫三哈）。假如有两个线程，其中一个线程刚到狗改名字的阶段，结果第二个线程刚声明了一个同样名称的类还没有实例化，由于两个类的名字相同，就会导致第一个线程出现这个类还没有实例化，所示不能改名字的现象（出错）。如果一定要用那就“锁住”，或者使用数组（而不是链表）的形式。
Parallel.ForEach 多线程声明失败 "未将对象引用设置到对象的实例"
飞舞的哈哈: 这个其实就是在并行运算中尽量不要出现对同一个变量进行初始化或者更改。举个例子，如果在多线程中出现了声明了一个变量dog（狗），然后进行实例化dog.name="二哈"（狗的名字叫二哈），对狗的名字进行更改dog.name="三哈"（狗的名字叫三哈）。假如有两个线程，其中一个线程刚到狗改名字的阶段，结果第二个线程刚声明了一个同样名称的类还没有实例化，由于两个类的名字相同，就会导致第一个线程出现这个类还没有实例化，所示不能改名字的现象（出错）。如果一定要用那就“锁住”，或者使用数组（而不是链表）的形式。
21岁大专学历，刚培训完前端，不造假简历，能找到工作吗？
我真菜呀: 如果你要包装简历，你首先想一想你的能力有没有达到人家公司的要求？
动态添加+动态绑定（vue数据驱动思路）
aa555_: 哥，有源码吗

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。