然后我们来,看个配置yarn 生产环境核心参数的案例
首先我们的需求就是,我们要统计1G数据中,每个单词出现的次数.
我们有3台服务器,然后每台配置4G,4核cpu,4线程.可以看到
然后就是去配置yarn的参数,按照我们实际的环境
我们先分析一下需求,可以看到,我们有1G的文件需要处理,那么
如果我们每个maptask用默认的处理128M的内容,那么需要8个MapTask 1个reducetask
1个 mr
然后我们来,看个配置yarn 生产环境核心参数的案例
首先我们的需求就是,我们要统计1G数据中,每个单词出现的次数.
我们有3台服务器,然后每台配置4G,4核cpu,4线程.可以看到
然后就是去配置yarn的参数,按照我们实际的环境
我们先分析一下需求,可以看到,我们有1G的文件需要处理,那么
如果我们每个maptask用默认的处理128M的内容,那么需要8个MapTask 1个reducetask
1个 mr