在eclipse下运行Map-Reduce程序:
1,在eclipse新建项目。
File-->New-->Other-->Map/Reduce
Project
项目名可以随便取,如
HadoopTest
。
复制
hadoop
安装目录
/src/example/org/apache/hadoop/example/WordCount.java
到刚才新建的项目下面。
2
上传模拟数据文件夹。
为了运行程序,我们需要一个输入的文件夹,和输出的文件夹。输出文件夹,在程序运行完成后会自动生成。我们需要给程序一个输入文件夹。
在当前目录(如 hadoop 安装目录)下新建文件夹 input ,并在文件夹下新建文件 file0 1 ,文件内容如下:
hello map-reduce eclipse goodbye
1>在已经启动 Hadoop 守护进程终端中 cd 到 hadoop 安装目录,运行下面命令:
bin/hadoop fs -put input input01
or hadoop fs -put input input01
2>这个命令将 input 文件夹上传到了 hadoop 文件系统了,在该系统下就多了一个 input01 文件夹,你可以使用下面命令查看:
bin/hadoop fs -ls or hadoop fs -ls
3>
在新建的项目
HadoopTest
,点击
WordCount.java
,右键
-->Run
As-->Run Configurations
4>
在弹出的
Run
Configurations
对话框中,点
Java
Application
,右键
-->New
,这时会新建一个
application
名为
WordCount
5>
配置运行参数,点
Arguments
,在
Program
arguments
中输入“你要传给程序的输入文件夹和你要求程序将计算结果保存的文件夹”,如:
hdfs://localhost:9000/user/hadoop/input01 hdfs://localhost:9000/home/hadoop/Desktop/data/output01
6> 点击 Run ,运行程序
7>查看运行结果:
hadoop fs -ls /home/hadoop/Desktop/data
8>查看内容
hadoop fs -cat /home/hadoop/Desktop/data/output01/*