【超详细】InteillJ JAVA运行MapReduce程序

最新推荐文章于 2023-10-09 08:11:04 发布

原创

最新推荐文章于 2023-10-09 08:11:04 发布

· 669 阅读

6 ·

版权

文章标签：

#hadoop

MapReduce【开发】

需求：统计一堆文件中单词出现的个数。

Driver函数的流程：

获取配置信息，获取job对象实例
指定本程序jar包所在的本地路径
指定mapper，reducer业务类
指定mapper输出数据的kv类型
指定最终输出的数据的kv类型
指定job的输入原始文件所在的目录
指定job的输出粗结果所在的目录
提交作业

a. 环境搭建（WordCount入门例子）

创建一个maven工程
Mapper模板

package edu.durant.hadoop;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

//KIN,VIN,KOUT,VOUT
public class wordcntMapper extends Mapper<LongWritable, Text, Text, IntWritable>{
   
    Text k = new Text();
    IntWritable v = new IntWritable(1);
    @Override
    protected  void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
   
        String line = value.toString();
        String[] words = line.split(" ");
        for (String word : words) {
   
            k.set(word);
            context.write(k,v);
        }
    }

}

注意：Map的<>内前两个参数必须是LongWritable, Text，这是系统定义的。

Reducer模板


   public class IntSumReducer<Key> extends Reducer

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

BonjourDurant

关注关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

使用Java语言编写MapReduce程序

m0_67856325的博客

09-06

664

（2）编写执行类、map、reduce类。(2)掌握使用Java语言编写MapReduce程序的基本步骤和方法。(3) 编写pom.xml文件（具体内容参考教材）。(2) 编写log4j.properties文件。(4)掌握编译与执行MapReduce程序的方法。(1)掌握使用MapReduce分析数据的方法。(1)掌握编写pom.xml文件的基本方法。(2)学会使用Maven面板编译和打包项目。(3) 编写主执行类MyWordCount。(2)熟练掌握配置Maven、插件的方法。

Java如何使用mapreduce_MapReduce简单使用

weixin_39989443的博客

02-19

1616

1、启动hadoop工程 2、MapReduce统计文本单词数量publicclassWordCount{privatestaticclassWordMapperextendsMapper{@Overrideprotectedvoidmap(LongWritablekey,Textvalue,Mapper.Contextcontext)throwsIOExceptio...

4 条评论您还未登录，请先登录后发表或查看评论

java调用mapreduce_从简单的Java程序调用mapreduce作业

weixin_33856202的博客

02-16

494

烙印99从Java Web应用程序(Servlet)调用MapReduce作业您可以使用Java API从Web应用程序调用MapReduce作业。这是一个从Servlet调用MapReduce作业的小例子。步骤如下：步骤1：首先创建一个MapReduce驱动程序servlet类。同时开发地图并减少服务。这是一个示例代码片段：CallJobFromServlet.java public cl...

Java/Web调用Hadoop进行MapReduce示例

陈杰

05-13

2万+

使用Java或JavaWeb封装Hadoop进行远程调用Hadoop MapReduce任务。

java调用mapreduce,从一个简单的java程序调用mapreduce工作

weixin_39685697的博客

03-16

187

哦，请不要用runJar，Java API非常好。看看如何从正常的代码开始工作：// create a configurationConfiguration conf = new Configuration();// create a new job based on the configurationJob job = new Job(conf);// here you have to put ...

java实现mapreduce_Java 实现MapReduce函数

weixin_31437175的博客

02-12

2312

明白了MapReduce程序的工作原理之后，下一步就是写代码来实现它。我们需要三样东西：一个map函数、一个reduce函数和一些用来运行作业的代码。map函数由Mapper类来表示，后者声明一个map()虚方法。范例2-3显示了我们的map函数实现。范例2-3 查找最高气温的Mapper类Import java.Io.IOException;importorg.apahce.hadoop.io....

Hadoop Core_MapReduce总结（二)_WordCount

weixin_40235225的博客

12-20

267

三、MapReduce Java API 应用 MapReduce 开发流程（1）搭建开发环境，参考 HDFS 环境搭建，基本一致（2）基于 MapReduce 框架编写代码（3）编译打包，将源代码和依赖 jar 包打成一个包（4）上传至运行环境运行 hadoop jar 命令，现已由 yarn jar 替代，建议使用新命令提交执行 WordCount代码实现 Map类编写 Mappe...

Java/Web调用Hadoop进行MapReduce示例代码

08-28

本篇文章主要介绍了Java/Web调用Hadoop进行MapReduce示例代码，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧

MapReduce编程(一) Intellij Idea配置MapReduce编程环境

最新发布

maxuecsdn123456的博客

10-09

620

注2：指定要处理的数据所在的位置"D:/mr/input"，不存在要提前创建；// 指定处理完成之后的结果所保存的位置"D:/mr/output"；定位在WordCountDriver.java代码页面，右键-》运行方式-》Java应用程序。由于集群运行模式较为简单，所以我们选择本地运行模式，帮助大家更好理解MapReduce的运行思想。（2）接下来是：WordCountReducer.java代码。其中part-r-00000是我们需要的结果文件！目的是将转化为

MapReduce3种运行方式

MrGrant.blog

07-26

1322

MapReduce运行 3 种方式：一、本地方式运行： 1、pc环境： 1.1、将Hadoop安装本地解压 1.2、配置Hadoop的环境变量添加%HADOOP_HOME% 修改%PATH% 添加%HADOOP_HOME%/bin;%HADOOP_HOME%/sbin 1.3、在解压的Hadoop的bin目录下添加winutils...

IDEA下配置Hadoop Mapreduce开发环境并实现本地运行

Grey0125的博客

04-08

3025

IDEA下配置Hadoop开发环境配置环境变量系统环境变量添加HADOOP_HOME，指向hadoop目录的根目录，如 F:\hadoop-2.7.7 对环境变量PATH追加：%HADOOP_HOME%\bin 将变量JAVA_HOME路径中的Program file换成PROGRA~1（空格识别不了）配置好环境变量后，需要重启软件才能生效。因此需要将IDEA关闭后重新打开，才能正确识别刚刚配置的环境变量。导入集群配置文件把Hadoop主机的core-site.xml、hdfs-site.

MapReduce程序在Idea中的开发与调试

一半的博客

04-12

2488

一、环境说明系统：Win10 Hadoop版本：2.10.1 JDK：1.8 二、环境准备 1、下载hadoop 下载链接hadoop 2.10.1。下载后用解压到本地。 2、下载winutils 下载链接winutils，下载完成后解压到本地，然后复制hadoop对应版本或就近版本的文件夹中的hadoop.dll与winutils.exe文件到hadoop的bin目录中去。 3、配置环境变量新建环境变量HADOOP_HOME，值为hadoop文件夹的位置添加变量到PATH 4、最好需要重启

Mapreduce部署与第三方依赖包管理

深入一点

06-12

351

Mapreduce部署是总会涉及到第三方包依赖问题，这些第三方包配置的方式不同，会对mapreduce的部署便捷性有一些影响，有时候还会导致脚本出错。本文介绍几种常用的配置方式: 1. HADOOP_CLASSPATH 在hadoop的相关配置文件中，添加CLASSPATH路径，那么在hadoop的各个进程启动时都会载入这些包，因此对于mapreduce-job ja...

InteillJ IDEA 运行HDFS客户端程序

qq_32439305的博客

06-05

319

开发环境：InteillJ IDEA 2020.3(Community Version) WINDOWS 10

【知识学习】IDEA开发Hadoop MapReduce程序

cls1277的博客

06-26

1263

https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.10.1/ （1）首先注意SDK的配置（2）加入Hadoop的jar包依赖（3）打包配置根据自己需求写代码，下面附代码样本。（1）mapper代码：（2）reduce代码片断：（3）run/main代码： 5、配置编译器右上角：注意：第三个框里只需添入输入路径和输出路径即可6、将数据导入到你的程序中注意：不要创建output目录，系统会自

java mapreduce示例,MapReduce示例

weixin_29574585的博客

03-10

213

WordCountmap类import java.io.IOException;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;/***...

深入浅出Java实现MapReduce程序的步骤解析

标题中“Java编写Mapreduce程序过程浅析”直接指示了本文的知识点将围绕使用Java语言编写MapReduce程序的过程展开。MapReduce是一种编程模型，用于大规模数据集的并行运算。该模型最早由Google提出，并被广泛用于...