
MapReduce
文章平均质量分 92
小张小张永远不慌
这个作者很懒,什么都没留下…
展开
-
mapreduce------shuffle过程解析
Mapreduce程序分为五个阶段:inputmapshufflereduceoutput其中shuffle是Mapreduce的核心,它的主要职责是把map的输出结果有效的·传送到reduce端。其过程分为map端和reduce端的操作。对shuffle过程的理解尤为重要,mapreduce的优化通常是对shuffle过程进行优化,shuffle过程在面试中也会经常问到。对shuf...原创 2019-11-07 21:28:52 · 534 阅读 · 0 评论 -
mapreduce------学生成绩(六)
知识准备reducer类的操作对象是分区,一个分区初始化一次reducer类。reduce()函数的操作对象是组,一个分区中有几个分组就调用几次reduce()函数。分组默认采用通过比较键的方式来实现。当自定义组合键时,往往需要根据组合键中的某一个属性进行分组统计,此时就用到自定义分组类。通过重写其中的compare()方法定义分组规则。分组前先对合并后的分区文件中的记录进行排序,排序后再...原创 2019-10-09 16:35:50 · 501 阅读 · 2 评论 -
mapreduce------学生成绩(五)
数据computer,huangxiaoming,85,86,41,75,93,42,85computer,xuzheng,54,52,86,91,42computer,huangbo,85,42,96,38english,zhaobenshan,54,52,86,91,42,85,75english,liuyifei,85,41,75,21,85,96,14algorithm,liu...原创 2019-10-05 22:11:22 · 427 阅读 · 0 评论 -
DecimalFormat 保留小数格式化
DecimalFormat format 方法大家在format()一个小数是,总是对格式中的’0’和’#'有些不解吧!eg:1:new DecimalFormat(“00.000”).format(pi) //结果:03.1422:new DecimalFormat("##.###").format(pi) //结果:3.142都是对pi进行格式化,但第一个的结果是03.142,第二个...转载 2019-10-05 20:30:11 · 436 阅读 · 0 评论 -
mapreduce------学生成绩(四)
知识准备在进行mapreduce编程时key键往往用于分组或排序,当我们在进行这些操作时Hadoop内置的key键数据类型不能满足需求时,或针对用例优化自定义数据类型可能执行的更好。因此可以通过实现org.apache.hadoop.io.WritableComparable接口,自定义一个WritableComparable类型,并使其作为mapreduce计算的key类型。2.自定义H...原创 2019-10-05 20:46:08 · 1195 阅读 · 0 评论 -
利用mapreduce中某些基本类的内置比较方法实现倒序排序
在mapreudce的类如IntWritable,LongWritable,Text等都有一个内置的比较函数,而我们可以对其进行修改实现简单的倒序排序。默认都是正序的从小到大。//如果是LongWritable类型的直接写成LongWritable.Comparaor即可,以此类推public static class MyNumberComparator extends IntWritabl...原创 2019-10-03 10:43:30 · 279 阅读 · 0 评论 -
mapreduce-----学生成绩(3)
数据:computer,huangxiaoming,85,86,41,75,93,42,85computer,xuzheng,54,52,86,91,42computer,huangbo,85,42,96,38english,zhaobenshan,54,52,86,91,42,85,75english,liuyifei,85,41,75,21,85,96,14algorithm,li...原创 2019-09-19 22:00:05 · 555 阅读 · 0 评论 -
mapreduce-----学生成绩(2)
数据:需求:求该成绩表每门课程当中出现了相同分数的分数,还有次数,以及该分数的人数。代码:在这里package test;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.i...原创 2019-09-17 22:43:00 · 443 阅读 · 0 评论 -
Mapreduce--------学生成绩(1)
数据:computer,huangxiaoming,85computer,xuzheng,54computer,huangbo,86computer,liutao,85computer,huanglei,99computer,liujialing,85computer,liuyifei,75computer,huangdatou,48computer,huangjiaju,88...原创 2019-09-17 11:47:39 · 455 阅读 · 0 评论 -
过滤,替换
数据36.63.116.201|sdk.conf.igexin.com|20170207161935|61.147.218.24;222.186.20.109;222.186.20.123|036.63.123.215|cm052.getui.igexin.com|20170207161935|183.131.1.82|036.63.132.38|mmbiz.qpic.cn|20170207...原创 2019-10-03 14:42:11 · 1320 阅读 · 0 评论