hadoop学习-Mapper和Reducer的输出类型

本文介绍了Hadoop中Mapper和Reducer的输出类型,Mapper一般由job.setInputFormatClass()指定,如TextInputFormat.class。Mapper和Reducer的K2 V2需一致,Reducer输出类型通过job.setOutputKeyClass()和job.setOutputValueClass()设定,同时也设定了Mapper的输出类型。若要Mapper和Reducer输出类型不同,可使用setMapOutputKeyClass和setMapOutputValueClass。举例说明了一个Mapper输出<Text,LongWritable>,Reducer输出<Text,Text>的情况,并指出类型不匹配会导致错误,解决方法是正确设置输出类型。" 49421779,5246519,卷积神经网络(CNN)详解与应用,"['卷积核', '神经网络', '图像识别', '深度学习', '特征映射']

Mapper过程:Mapper<K1, V1, K2, V2 >

Reducer过程:Reducer<K2, V2, K3, V3 >

K1,V1 的类型一般由job.setInputFormatClass()指定,比如job.setInputFormatClass(TextInputFormat.class)等等;

Mapper和Reducer的K2 V2需要保持一致;

Reducer的输出K3 V3 一般由job.setOutputKeyClass(Text.class);job.setOutputValueClass(Text.class);设置

当然这里设置的不仅仅是Reducer的输出类型,同时也设置了Mapper的输出类型。即Mapper和Reducer的输出类型被设置成一样了。

如果想要Mapper和Reducer的输出key或value类型不同,可以通过setMapOutputKeyClass 和 setMapOutputValueClass来设定Mapper的输出key/value对。

举个例子,我写的Mapper类如下:

  static class FetchMapper extends Mapper<LongWritable, Text, Text, LongWritable>{ }

  而Reducer类如下:

  tatic class FetchReducer extends Reducer<Text, LongWritable, Text, Text> { }

  这时红色部分表明了FetchMapper的输出<k2,v2>  <Text,LongWritable> ,而 FetchReducer的输出为<k3,v3> <Text,Text>。可见v2 和 v3 是不同的。此时如果用下面的设置启动程序的话就会出现Type mismatched 错误:

        job.setInputFormatClass(TextInputFormat.class);
        job.setOutputFormatClass(TextOutputFormat.class);    
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(Text.class);

  而加上红色部分的代码则可以解决这个问题。

      job.setInputFormatClass(TextInputFormat.class);
        job.setOutputFormatClass(TextOutputFormat.class);
        job.setMapOutputValueClass(LongWritable.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(Text.class);


参考资料:

《Hadoop in Action》

http://www.cnblogs.com/keep-fighting/archive/2012/08/23/2653231.html

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值