MapReduce作业的几种输入输出方式设置

一、作业文件输入分片读入格式设置 

import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.input.KeyValueTextInputFormat;

//1.设置文件输入分片格式:KeyValueTextInputFormat.class
//此种读入方式存在两种情况:(纯文本)
//1.1.若制表符'\t'存在,则将文件默认按每一行的第一个制表符分割为key/value对;
//1.2.若制表符'\t'不存在,则将整行作为key,value置为null。
job.setInputFormatClass(KeyValueTextInputFormat.class);

//2.设置文件输入分片格式:TextInputFormat.class
//此种读入方式就一种情况:(纯文本)
//2.1.将每行行号作为key,整行内容作为value。
job.setInputFormatClass(TextInputFormat.class);

二、作业输出文件格式设置

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

//作业输出格式设置为:纯文本
job.setOutputFormatClass(TextOutputFormat.class);

三、Map任务/Reduce任务输出键值对类型设置 

//设置map输出key/value格式
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(Text.class);

//设置reduce输出(作业输出)key/value格式
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(Text.class);

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值