hadoop mapreduce入门实例

本文详细介绍了一个基于Hadoop的简单WordCount MapReduce实例,包括自定义Mapper和Reducer类的实现,以及如何设置Job参数来运行任务。

转自:https://www.cnblogs.com/liuwei6/p/6708116.html

自己写的一个简单的wordcount  mapreduce实例

三个类

自定义的mapper类

继承 org.apache.hadoop.mapreduce.Mapper类,并需要填写四个泛型类,分别代表key-in的数据类型,value-in的数据类型,key-out的数据类型,value-out的数据类型,key-in为偏移量,所以为long类型,采用hadoop序列化框架中的数据类型

Long--->LongWritable

String-->Text

Int-->IntWritable

Null-->NullWritable

方法中自定义切分规则

package com.zjxt.demo.map;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

/**
 * @Author: heiheihaxi
 * @Date: 2019/9/23 17:29
 */
public class MyWordCountMapper extends Mapper<LongWritable, Text, Text, IntWritable>{
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

        String[] split = value.toString().split("-");
        for (String val : split){
            context.write(new Text(val), new IntWritable(1));
        }

    }
}

Reduce类

package com.zjxt.demo.reduce;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

/**
 * @Author: heiheihaxi
 * @Date: 2019/9/23 17:39
 */
public class MyWordCountReduce extends Reducer<Text, IntWritable, Text, IntWritable> {
    @Override
    protected void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
        int sum = 0;

        for (IntWritable value : values){
            sum += value.get();
        }

        context.write(key, new IntWritable(sum));

    }
}

 

Job类

package com.zjxt.demo.job;

import com.zjxt.demo.map.MyWordCountMapper;
import com.zjxt.demo.reduce.MyWordCountReduce;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.IOException;

/**
 * @Author: heiheihaxi
 * @Date: 2019/9/23 17:42
 */
public class MyWrodCountJob {
    public static void main(String[] args) {

        Configuration conf = new Configuration();

        try {
            Job job = Job.getInstance(conf);

            job.setJarByClass(MyWrodCountJob.class);

            job.setMapperClass(MyWordCountMapper.class);
            job.setReducerClass(MyWordCountReduce.class);

            job.setMapOutputKeyClass(Text.class);
            job.setMapOutputValueClass(IntWritable.class);

            job.setOutputKeyClass(Text.class);
            job.setOutputValueClass(IntWritable.class);

            Path input = new Path("hdfs://namenodecluster/tmp/test/input/test.txt");
            Path output = new Path("hdfs://namenodecluster/tmp/test/output");

            FileInputFormat.setInputPaths(job, input);
            FileOutputFormat.setOutputPath(job, output);

            boolean b = job.waitForCompletion(true);

            System.out.println("successs");
            System.exit(b ? 0 : 1);


        } catch (IOException | ClassNotFoundException | InterruptedException e) {
            e.printStackTrace();
        }

    }
}

最后,我的只能打包在hdfs的客户端上运行,不能在idea本机运行,本机运行虽然不报错,并没有结果文件输出。

基于模拟退火的计算器 在线运行 访问run.bcjh.xyz。 先展示下效果 https://pan.quark.cn/s/cc95c98c3760 参见此仓库。 使用方法(本地安装包) 前往Releases · hjenryin/BCJH-Metropolis下载最新 ,解压后输入游戏内校验码即可使用。 配置厨具 已在2.0.0弃用。 直接使用白菜菊花代码,保留高级厨具,新手池厨具可变。 更改迭代次数 如有需要,可以更改 中39行的数字来设置迭代次数。 本地编译 如果在windows平台,需要使用MSBuild编译,并将 改为ANSI编码。 如有条件,强烈建议这种本地运行(运行可加速、可多次重复)。 在 下运行 ,是游戏中的白菜菊花校验码。 编译、运行: - 在根目录新建 文件夹并 至build - - 使用 (linux) 或 (windows) 运行。 最后在命令行就可以得到输出结果了! (注意顺序)(得到厨师-技法,表示对应新手池厨具) 注:linux下不支持多任务选择 云端编译已在2.0.0弃用。 局限性 已知的问题: - 无法得到最优解! 只能得到一个比较好的解,有助于开阔思路。 - 无法选择菜品数量(默认拉满)。 可能有一定门槛。 (这可能有助于防止这类辅助工具的滥用导致分数膨胀? )(你问我为什么不用其他语言写? python一个晚上就写好了,结果因为有涉及json读写很多类型没法推断,jit用不了,算这个太慢了,所以就用c++写了) 工作原理 采用两层模拟退火来最大化总能量。 第一层为三个厨师,其能量用第二层模拟退火来估计。 也就是说,这套方法理论上也能算厨神(只要能够在非常快的时间内,算出一个厨神面板的得分),但是加上厨神的食材限制工作量有点大……以后再说吧。 (...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值