自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 MapReduce学生成绩分类案例

一、问题描述 学校的学生的是一个非常大的生成数据的集体,比如每次考试的成绩,现有一个班级的学生一个月的考试成绩数据。 科目 姓名 分数 求出每门成绩中属于甲级的学生人数和总人数,乙级的学生人数和总人数,丙级的学生人数和总人数。 甲级(90及以上) 乙级(80到89) 丙级(0到79) 处理数据结果:课程\t甲级\t学生1,学生2,…\t总人数 二、思路介绍 map阶段将课程名和等级拼接为key,...

2019-06-22 17:44:57 1665 2

原创 MapReduce求最大值最小值平均值案例

一、问题描述 学校的学生的是一个非常大的生成数据的集体,比如每次考试的成绩。现有一个班级的学生一个月的考试成绩数据。 科目 姓名 分数 求出每个学生的最高分,平均成绩(整数(不能使用强制类型转换)),最低分。 二、思路介绍 在map阶段将学生姓名作为key,成绩作为value输出; 在reduce阶段进行最大值最小值平均值得求值。 三、代码实现 1、Map阶段 package com.stude...

2019-06-22 17:07:06 5564

原创 MapJoin与ReduceJoin实例

产品表: 订单表: 需求:通过产品表和订单表得到,数据为(2019 01 小米 1)的表。 一、MapJoin MapJoin适合小表+大表的联合。 1、Map类直接进行join操作 package com.join.mapjoin; import org.apache.commons.lang.StringUtils; import org.apache.hadoop.io.LongWri...

2019-06-20 23:57:31 450

原创 MapReduce二次排序案例,并且在Reduce输出时进行压缩

MapReduce二次排序案例,并且在Reduce输出时进行压缩一、原始数据二、代码展示1、自定义Bean对象封装数据合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLo...

2019-06-19 23:48:21 240

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除