攻城狮在路上(陆)-- 配置hadoop本地windows运行MapReduce程序环境

本文介绍如何在Windows环境中模拟运行Map/Reduce程序,通过在本地调试而不提交至实际集群,将结果写入HDFS。涉及环境搭建、代码修改及调试步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文的目的是实现在windows环境下实现模拟运行Map/Reduce程序。最终实现效果:MapReduce程序不会被提交到实际集群,但是运算结果会写入到集群的HDFS系统中

一、环境说明:

    操作系统:win7

    eclipse:Version: Mars Release (4.5.0)

    hadoop:2.5.1

二、预备文档(仅是说明,以第三步为准):

System.setProperty("HADOOP_USER_NAME", "root");

本地测试环境(windows):

    在windows的hadoop目录bin目录有一个winutils.exe

    1、在windows下配置hadoop的环境变量

    2、拷贝debug工具(winutils.exe)到HADOOP_HOME/bin

    3、修改hadoop的源码 ,注意:确保项目的lib需要真实安装的jdk的lib

    4、MR调用的代码需要改变:

        a、src不能有服务器的hadoop配置文件

        b、在调用是使用:

            Configuration config = new  Configuration();

            config.set("fs.defaultFS", "hdfs://node7:8020");

            config.set("yarn.resourcemanager.hostname", "node7");

三、基本步骤说明:

1、首先下载hadoop包,这里使用的是hadoop-2.5.1。解压后的路径是:E:\hadoop\hadoop-2.5.1

2、下载winutils.exe。将该软件拷贝到E:\hadoop\hadoop-2.5.1\bin下

image

3、在windows中配置HADOOP_HOME环境变量为E:\hadoop\hadoop-2.5.1,并加入到path环境变量中。

4、修改hadoop源码,在新建的Java project中拷贝下面路径的Java代码。路径保持和原来一致。

org/apache/hadoop/io/nativeio/NativeIO.java
org/apache/hadoop/mapred/YARNRunner.java

image

5、在java project的buildpath中设置,jdk不要使用eclipse自带的,修改为自己本地安装的Jdk。

6、其他限制条件:

    A、src中不能有服务器的hadoop配置文件。

    B、在调用时使用下面的代码:根据实际配置进行修改下面的参数

System.setProperty("HADOOP_USER_NAME", "root");

Configuration config = new  Configuration();

config.set("fs.defaultFS", "hdfs://node7:8020");

 config.set("yarn.resourcemanager.hostname", "node7");

7、运行代码:在eclipse中以DEBUG执行main方法即可。可以在Mapper和Reduce中打断点调试。

转载于:https://www.cnblogs.com/tq03/p/5101916.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值