MapReduce及Yarn

本文详细介绍了MapReduce的工作原理及其在Hadoop环境下的应用,包括任务分解和结果汇总的过程。通过具体步骤展示了如何在虚拟机上配置MapReduce和YARN,使其能够在集群环境中运行。同时,还提供了实例分析,演示了如何使用MapReduce统计单词频率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

MapReduce

思想

任务的分解Map(拉取数据、分组、排序),结果的汇总Reduce

原理

在这里插入图片描述

实例

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

环境搭建

在这里插入图片描述

环境搭建具体步骤

1.打开虚拟机和连接工具secureCRT,将所有进程都停掉,找到cd $HADOOP_HOME其下的/etc/hadoop
2.cp mapred-site.xml.template mapred-site.xml然后在 mapred-site.xml里面做更改
3.vi mapred-site.xml;在configuration里面增加并保存

<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
  </property>

4.vi yarn-site.xml;在configuration里面增加并保存

 <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
<property>
   <name>yarn.resourcemanager.ha.enabled</name>
   <value>true</value>
 </property>
 <property>
   <name>yarn.resourcemanager.cluster-id</name>
   <value>cluster1</value>
 </property>
 <property>
   <name>yarn.resourcemanager.ha.rm-ids</name>
   <value>rm1,rm2</value>
 </property>
 <property>
   <name>yarn.resourcemanager.hostname.rm1</name>
   <value>node03</value>
 </property>
 <property>
   <name>yarn.resourcemanager.hostname.rm2</name>
   <value>node04</value>
 </property>
 <property>
   <name>yarn.resourcemanager.zk-address</name>
   <value>node02:2181,node03:2181,node04:2181</value>
 </property>

5.分发这两个文件给node02~node04;scp mapred-site.xml yarn-site.xml node02:pwd
6.实现node03,node04互相免密钥。在node03产生密钥文件:ssh-keygen -t rsa,此时在.ssh里面就出现了公钥和私钥。先给自己免密钥,追加到authorized_keys:cat id_rsa.pub >> authorized_keys。将公钥文件发送给node04:scp id_rsa.pub node04:pwd/node03.pub。在node04的node03.pub追加到authorized_keys认证文件当中。
7.启动node02、node03、04中的zookeeper:zkServer.sh start;启动node01中的hdfs:start-dfs.sh;启动node01中的mapReduce:start-yarn.sh只能开启nodemanager;启动yarn:yarn-daemon.sh start resourcemanager

分析实例

1.在node01中,cd 编写hello.txt并上传:hdfs dfs -put hello.txt /user/root
2.查看一下该文件:hdfs dfs -cat /user/root/hello.txt
3.cd $HADOOP_HOME;cd share/hadoop/mapreduce/
4.使用已存在的统计单词的jar文件执行统计单词的任务:hadoop jar hadoop-mapreduce-examples-2.7.5.jar wordcount /user/root/hello.txt /output1
5.查看输出结果:hdfs dfs -ls /output1;hdfs dfs -cat /output1/*

YARN

架构介绍

在这里插入图片描述

体系结构

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值