hadoop学习笔记-4-eclipse运行MapReduce

原创于 2012-11-01 12:15:49 发布 · 2k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

hadoop学习笔记专栏收录该内容

8 篇文章

订阅专栏

本文档介绍了如何在Eclipse中安装、配置并运行Hadoop MapReduce程序。首先，详细讲述了Eclipse的安装步骤，然后指导如何配置Hadoop插件，包括设置Hadoop安装目录及MapReduce相关配置。接着，提到了如何在Eclipse中创建MapReduce项目，并将示例程序(wordcount)导入。最后，阐述了运行MapReduce程序的配置，如输入输出目录的指定，以及运行过程中可能遇到的问题和解决办法。

Eclipse安装

1. 下载eclipse安装包：eclipse-SDK-4.2.1-Linux.tar.gz

2. 解压到指定目录：例如/usr/local

3. 运行./eclipse即可

使用Eclipse开发MapReduce程序

1. 将hadoop安装目录的contribute/eclipse-plugin中的jar包拷贝至eclipse安装目录下的plugins中

2. 重新启动eclipse

3. 在Windows-preference中有Hadoop-MapReduce的配置路径，配置其中的hadoop安装目录，点击ok

4. 配置MapReduce，选择map/reduce视图，选择下方的MapReduce这个栏目，选中大象，右击，编辑，其中DFSMaster配置对应于hadoop配置文件的core-site.xml，MapReduct Master配置对应于map-red-core.xml中配置的端口信息，下方的User name用于免账号ssh登录时候的用户名。

5. 点击确定之后，可以在eclipse的左侧导航看到文件系统中的目录和文件。

注意：

1. 如果不能看到文件系统中的文件，尝试以下步骤，重新格式化文件系统：

stop-all.sh，hadoop namenode –format，start-all.sh

（伪分布式环境，每次重新启动系统的时候需要重新格式化文件系统，否则会出现链接失败的情况，Call to localhost/127.0.0.1:8021 failed on connection exception:java net ConnectException）

Eclipse运行hadoop程序

需要注意MapReduct程序都是对文件系统中的文件进行操作，所以一般在运行的时候需要将文件拷贝至hdfs，并且指定运行参数（比如输入和输出目录）。

1. 新建Project – MapReduct Project

2. 创建包和类

3. 将hadoop安装目录中的wordcount程序内容拷贝过来（安装目录/src/examples/中）

4. 右击要运行的类，Run—Run Configuration，配置输入和输出目录

5. 指定输入目录和输出目录，下图所示。

6. 其中其中的hdfs://localhost是在core-site.xml配置文件的里定义的fs.default.name的值，下图表示输入目录为in2，输入目录为out

运行结果：

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。