使用Eclipse连接远程Hadoop集群并运行实例

本文介绍了Hadoop在本地的部署过程,包括解压、添加文件、添加插件、配置环境等步骤。还说明了如何在Eclipse中新建连接并运行wordCount程序,针对初次运行可能出现的问题,给出了log4j配置信息,保存配置后重新运行即可成功。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. 首先将Hadoop解压到本地

  1. 在bin中添加两个文件hadoop.dll和winutils.exe

不自带,需要从网上下载(过段时间发上来)

1.x版本的不适用

  1. 添加Eclipse-Hadoop-plugins插件放到Eclipse安装目录的plugins文件夹中

  1. 添加环境

Path末加D:\softWare\hadoop\hadoop-2.6.5\bin

  1. 启动Eclipse

  1. 新建连接

  1. 1

与这里的一致

  1. 运行wordCount程序

复制过来

  1. 新建文件夹,以及一个文件

将这个文件上传到dfs

  1. 进行运行前的配置

  1. 运行查看结果

初次运行只打印了这些

这种情况一般是由于log4j这个日志信息打印模块的配置信息没有给出造成的,可以在项目的src目录下,新建一个文件new->other->general->file,命名为“log4j.properties”,填入以下信息:

log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/spring.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

保存后重新运行即可成功。

成功:

 

 

如果没有指定输入输出路径控制台只打印这个

Usage: wordcount <in> [<in>...] <out>

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值