Hadoop MapReduce 作业链优化与实现
1. 基本作业配置与提交
在 Hadoop MapReduce 中,我们可以通过以下代码来配置和提交一个作业:
Job job = new Job(conf, "ParallelJobs");
job.setJarByClass(ParallelJobs.class);
job.setMapperClass(AverageReputationMapper.class);
job.setReducerClass(AverageReputationReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(DoubleWritable.class);
job.setInputFormatClass(TextInputFormat.class);
TextInputFormat.addInputPath(job, inputDir);
job.setOutputFormatClass(TextOutputFormat.class);
TextOutputFormat.setOutputPath(job, outputDir);
// Submit job and immediately return, rather than waiting for completion
job.submit();
return job;
上述代码创建了一个名为 ParallelJobs 的作业,设置了作业的 JAR 包、Mapper 类、Reducer 类、
超级会员免费看
订阅专栏 解锁全文
1982

被折叠的 条评论
为什么被折叠?



