linux下使用eclipse编程mapreduce

最新推荐文章于 2021-05-16 09:52:51 发布

原创最新推荐文章于 2021-05-16 09:52:51 发布 · 1.7k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

hadoop 专栏收录该内容

3 篇文章

订阅专栏

本文详细介绍如何在本地环境中配置Hadoop，并使用Eclipse进行Java项目的创建、包的导入、代码编写及编译打包流程。从新建项目、导入Hadoop相关包到编译打包，每一步都配有详细的步骤说明。

配置环境

生效：

启动

3、使用Eclipse:

（1）新建项目：

File-New-JavaProject

填上Project name 选择Next

导入包：

选择Librarises-Add External JARS

（全部过程：）

到usr/local/hadoop/share/hadoop里：

Common里的nfs和common-2.7.1.jar

common里的lib的全选

Hadoop 下的hdfs的最后三个

Mapreduce 第三个之后的全部

Mapreduce下的lib下的全部：

Hadoop下的yarn的第四个开始的全部：

导包全部完成。

（详细过程：）

到usr/local/hadoop/share/hadoop里：

Common里的nfs和common-2.7.1.jar

common里的lib的全选

Hadoop 下的hdfs的最后三个

Mapreduce 第三个之后的全部

Mapreduce下的lib下的全部：

Mapreduce下的lib下的全部：

Hadoop下的yarn的第四个开始的全部：

导包全部完成。

点击finish

(2)编写java应用程序：

点击刚刚创建好的工程Dedup，右键选择New-Class

在Name里输入Java类的名称，然后选择finish:

出现以下界面，点击创建的java即可编译代码：

填写代码：

以去重代码为例：

注意：

改为自己的地址。

运行：run as javaproject

浏览器输入localhost:9000（自己的端口号）

然后在 hadoop 目录下查看/output/part-r-00000

（3）编译打包程序：

在计算机/usr/local/hadoop新建了一个文件夹myapp放要建立的jar 包(jar包可以放在任意位置)

右键选择刚建的项目：export-Java-Runnable JAR file

在该界面中，选择“Runnable JAR file”，然后点Next

弹出下面界面：

“Launch configuration”选择自己的类

在“Export destination”中需要设置JAR包要输出保存到哪个目录

（4）运行jar包

到jar包存放的位置下（myapp目录下）输入命令

Hadoop jar Dedup.jar input output （运行该命令前要把代码中建的output文件夹删了，因为输出文件夹output是自动产生的，所以打包之前运行过，所以已经产生了，

hadoop fs –rm –R /output）

给一个输入文件目录/input 一个输出文件目录/output

查看结果：

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。