- 博客(4)
- 收藏
- 关注
原创 12.4 三
让类【TopNMapper】继承类Mapper同时指定需要的参数类型,根据业务逻辑修改map类的内容如下:package com.simple.topn;import java.io.IOException;import java.util.Arrays;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import
2020-12-04 22:03:43
224
原创 12.4 二
让类【DeduplicationMapper】继承类Mapper同时指定需要的参数类型,根据业务逻辑修改map类的内容如下。package com.simple.duduplication;import java.io.IOException;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;public class
2020-12-04 21:34:13
200
原创 2020-12-04
编写WordCountMapper类,完成对单词的切分处理,并以(k,v)的形式输出到Reduce阶段让【WordCountMapper】继承类Mapper同时指定需要的参数类型,根据业务逻辑修改map类的内容如下:package com.simple;import java.io.IOException;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.NullWritable;import org.apa
2020-12-04 21:07:22
289
原创 HDFS API作业
//HDFS API作业package com.hdfs;import java.io.IOException;import java.net.URI;import java.util.ArrayList;import java.util.List;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FSDataInputStream;import org.apache.hadoop.fs.FSDat
2020-12-02 13:29:44
238
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人