Hive 错误 ---＞Map operator initialization failed

最新推荐文章于 2023-06-07 17:11:52 发布

大数据langlang

最新推荐文章于 2023-06-07 17:11:52 发布

阅读量809

点赞数

CC 4.0 BY-SA版权

分类专栏： Hive开发总结文章标签： hive hql sql exception 数据库

本文链接：https://blog.youkuaiyun.com/LangLang1111111/article/details/119851139

Hive开发总结专栏收录该内容

3 篇文章

订阅专栏

本文探讨了一种在大数据查询中遇到的问题，即大表JOIN大表导致内存不足。通过分析，发现系统默认使用了大表JOIN小表的方式。为了解决这个问题，建议将设置调整为禁止大表JOIN小表，完成查询后再恢复原设置。这种方法能有效避免初始化失败，优化大数据处理效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

代码为:

 select videoId,category
    from gulivideo_orc
    where videoId in (
        select *
        from (
                 select relatedId_name
                 from (
                          select relatedId, `views`
                          from gulivideo_orc
                          order by `views` desc
                          limit 50
                      ) t1--找到top50
                lateral view explode(relatedId) tmp as relatedId_name
             ) t2 --找出top50对应的相关视频Id
                )

原因:大表join大表时内存不足导致初始化失败,自动默认的大表join小表,查看设置: