1、首先下载一个Hadoop包,仅Hadoop即可。
https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.10.1/
2、打开Idea新建一个java项目。


3、项目配置 File ---- Project Structure
(1)首先注意SDK的配置

(2)加入Hadoop的jar包依赖


(3)打包配置



4、开发map-reduce代码

根据自己需求写代码,下面附代码样本。
(1)mapper代码:

(2)reduce代码片断:

(3)run/main代码:

5、配置编译器
右上角:



注意:第三个框里只需添入输入路径和输出路径即可
6、将数据导入到你的程序中

注意:不要创建output目录,系统会自动创建。否则会报目录已存在的错。
7、运行
(1)运行成功:

(2)查看结果

本文档详细介绍了如何在IntelliJ IDEA(Idea)中配置并运行一个Hadoop MapReduce程序。步骤包括下载Hadoop包,新建Java项目,配置SDK和依赖,编写Mapper、Reducer及main函数代码,设置编译器参数,导入数据,以及运行和查看结果的过程。注意避免手动创建输出目录,以免引发错误。
1万+

被折叠的 条评论
为什么被折叠?



