hadoop mr 流程图

hadoop mr 流程图 博客分类: hadoop

 

hadoop 流程图

 

 

mapreduce运行机制,这些按照时间顺序包括:输入分片(input split)、map阶段、combiner阶段、shuffle阶段和reduce阶段



 
 

转载于:https://my.oschina.net/xiaominmin/blog/1597288

MR(MapReduce)环境的搭建通常是在大数据处理框架Hadoop上进行,以下是基本的搭建步骤,虽然没有图形化流程图,但可以文字描述: 1. **安装操作系统**:首先需要选择一个支持Linux的操作系统,因为Hadoop主要在Linux环境下运行。 2. **下载并配置Hadoop**: - 下载Hadoop官方网站提供的二进制包,包括Hadoop Distributed File System (HDFS) 和 MapReduce组件。 - 配置环境变量,如`JAVA_HOME`、`HADOOP_HOME`等,并创建配置文件(如核心-site.xml, hdfs-site.xml, mapred-site.xml)。 3. **安装JDK**:由于MapReduce依赖于Java,所以需要安装JDK。 4. **启动HDFS集群**: - 运行`sbin/start-dfs.sh` 启动NameNode(主节点)和DataNodes(数据节点)。 - 如果集群较大,可能还需要配置反向代理(如Namenode HA 或者 HDFS Federation)。 5. **启动YARN(可选)**: - 如果需要资源管理和调度,还需启动YARN服务,运行`sbin/start-yarn.sh`。 6. **测试HDFS和MapReduce**: - 使用命令`hadoop fs -ls /` 检查HDFS是否正常工作。 - 创建一个简单的MapReduce程序并在Hadoop Shell提交运行。 7. **监控和服务管理**: - 使用Hadoop的管理工具如`jps`查看进程,`hadoop dfsadmin -report` 查看文件系统状态。 - 定期检查日志和健康状况。 **注意事项**: - 网络设置很重要,确保所有节点能够互相通信。 - 根据实际需求调整内存分配、任务队列等配置。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值