Hive 错误 --->Map operator initialization failed

本文探讨了一种在大数据查询中遇到的问题,即大表JOIN大表导致内存不足。通过分析,发现系统默认使用了大表JOIN小表的方式。为了解决这个问题,建议将设置调整为禁止大表JOIN小表,完成查询后再恢复原设置。这种方法能有效避免初始化失败,优化大数据处理效率。

代码为:

 select videoId,category
    from gulivideo_orc
    where videoId in (
        select *
        from (
                 select relatedId_name
                 from (
                          select relatedId, `views`
                          from gulivideo_orc
                          order by `views` desc
                          limit 50
                      ) t1--找到top50
                lateral view explode(relatedId) tmp as relatedId_name
             ) t2 --找出top50对应的相关视频Id
                )

原因:大表join大表时内存不足导致初始化失败,自动默认的大表join小表,查看设置:

 

解决方法:

 

将大表join小表设置为false即可

最后记得运行完,将改值改为true;

 

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值