前提:这个例子是mapreduce的基本流程,需要已经搭建好的hadoop环境,至于hadoop,hdfs,mr的关系呢,看书吧。大概流程是这样的,hadoop环境搭建好以后,自己创建两个文件,通过hadoop命令将文件扔到hdfs里面。通过写代码通常java书写mapreduce程序,就可以对hdfs里面的文件进行相关操作,比如统计。下面的步骤主要是idea打包mr程序。
1 idea创建maven程序
file--->new-->project-->maven
2 maven,pom配置
setting里面搜索maven,将maven设置为自己的maven,不用默认的,自行搜索相关配置,很简单的
<dependencies>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-core</artifactId>
<version>1.2.1</version>
</dependency>
</dependencies>
<build>
<pluginManagement>
<plugins>