spark aggregateByKey 时 java.lang.OutOfMemoryError: GC overhead limit exceeded

本文描述了一个用户在单日内对网站进行了4千万次访问的情况,这一行为直接导致了服务器在进行数据聚合时内存不足的问题。文章指出,通过过滤掉该异常用户的数据,可以有效解决内存不足的问题。

最后发现有一个用户单日访问我们网站次数为 4千万,直接导致 aggregate 时内存不够。过滤掉该用户即可。

转载于:https://www.cnblogs.com/keepthinking/p/10467081.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值