Hadoop 里MapReduce里 实现多个job任务 包含(迭代式、依赖式、链式)

本文探讨Hadoop MapReduce中如何实现多个Job任务,包括迭代式方法,其中每个任务的输入是上一个任务的输出,以此达到最终结果。内容聚焦于关键代码实现。


一、迭代式,所谓的迭代式,下一个执行的Job任务以上一个Job的输出作为输入,最终得到想要的结果。 这里我只写关键的代码了

 
Job job = new Job(new Configuration(),“test”);

JobConf jobConf=(JobConf) job.getConfiguration();
jobConf.setJobName("hadoopJoinTask");

//设置job输入路径
FileInputFormat.setInputPaths(inputPath);
//设置job输出的路径
FileOutputFormat.setOutputPath(jobConf, outPath);

Job job2 = new Job(new Configuration(),“test2”);

JobConf jobConf2=(JobConf) job2.getConfiguration();
jobConf2.setJobName("hadoopJoinTask");

//设置job2输入路径  job的输出路径
FileInputFormat.setInputPaths(outPath);
//设置job2输出的路径
FileOutputFormat.setOutputPath(jobConf2, outPath2);



                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值