cloudra中 mapreduce.map.memory.mb 设置诡异（推荐设置问题）

最新推荐文章于 2024-01-31 15:49:09 发布

原创最新推荐文章于 2024-01-31 15:49:09 发布 · 5.2k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#mapreduce.map.memory.mb #合适值选择

大数据同时被 3 个专栏收录

74 篇文章

订阅专栏

cloudera

15 篇文章

订阅专栏

MapReduce

3 篇文章

订阅专栏

本文探讨了在CloudRA平台中，生产环境与测试环境对于MapReduce任务内存配置的不同需求。在生产环境中，由于主要处理日志解析，1GB的默认内存配置已足够；而在测试环境下，进行TPCx-BB基准测试时，因更复杂的数据处理需求，将内存配置提升至10GB以避免运行错误。文章深入分析了不同场景下内存需求变化的原因。

诡异问题

生产环境 mr 运行任务 map端和reduce 的运行内存都设置的为0 （此为cloudra 的默认配置）
在这里插入图片描述

为作业的每个 Map 任务分配的物理内存量(MiB)。对于早于 CDH 5.5 的版本，如果未指定内存量，则默认设置为 1024。对于 CDH 5.5 及更高版本，不支持小于 128 的值，但如果将其指定为 0，则可以通过 Map 任务的最大堆大小以及堆与容器的大小比值推断要请求的物理内存量。如果未指定 Map 任务的最大堆大小，则要请求的物理内存量默认设置为 1024。

根据提示他会参考最大堆的参数（也为0）所有更加配置得出其map 端和reduce 端都取默认值 1G

但是同样的配置在测试环境报错 143 （既运行内存不够的情况）

修改配置如下数据成功跑出
在这里插入图片描述