
大数据练习题
大数据练习题
Coder_Cjp
这个作者很懒,什么都没留下…
展开
-
经典案例Wordcount——Java mapreduce版(内部类、外部类)和Scala版对比
数据统计以下数据中每个单词出现的次数hello javahello scalahello helloworld worldhadoop hadoophello worldhello flumehadoop hivehive kafkaflume stormhive oozie原创 2021-07-09 11:02:31 · 226 阅读 · 0 评论 -
SQL练习题(3)
1.使用SQL根据表A,表B 计算出表C:数据附件:a表2019/1/1 742019/1/2 542019/1/3 192019/1/6 842019/1/7 22019/1/8 782019/1/9 192019/1/10 95--建表导入数据create table tb_a(s_date string,v1 int) row format delimited fields terminated by '\t';vim /root/aaa/tb_a.txt;load原创 2021-07-08 10:22:47 · 852 阅读 · 0 评论 -
HQL练习题(2)
有三份源数据文件,如下所示,请根据需求,编写对对那个的HQL语句。文件1: 学生表student <学号sid,姓名sname,性别ssex,年龄sage,系department>95001,李勇,男,20,CS95002,刘晨,女,19,IS95003,王敏,女,22,MA95004,张立,男,19,IS95005,刘刚,男,18,MA95006,赵丽,女,20,CS文件2: 成绩表score <学生编号sid,课程编号cid,成绩sscore>95001,1,8原创 2021-06-30 18:11:54 · 1605 阅读 · 0 评论 -
HQL练习题(1)
题目数据CREATE table Student(SId string,Sname string,Sage string,Ssex string);insert into Student values('01' , '赵雷' , '1990-01-01' , '男');insert into Student values('02' , '钱电' , '1990-12-21' , '男');insert into Student values('03' , '孙风' , '1990-12-20' ,原创 2021-06-30 17:54:11 · 255 阅读 · 0 评论 -
hadoop学习整理——mapreduce数据分析案例(3)--topN
数据样例:数据样例: xx(每次的考试分数 次数不固定)课程 姓名 xx xx xx xxcomputer,huangxiaoming,85,86,41,75,93,42,85computer,xuzheng,54,52,86,91,42computer,huangbo,85,42,96,38english,zhaobenshan,54,52,86,91,42,85,75english,liuyifei,85,41,75,21,85,96,14algorithm,liuyifei原创 2021-06-08 21:57:48 · 556 阅读 · 2 评论 -
hadoop学习整理——mapreduce数据分析案例(2)
题目:现有一张emp表,字段分别为员工编号,员工姓名,工作,管理编号,生日,工资,备注,部门编号数据:7369,SMITH,CLERK,7902,1980/12/17,800,,207499,ALLEN,SALESMAN,7698,1981/2/20,1600,300,307521,WARD,SALESMAN,7698,1981/2/22,1250,500,307566,JONES,MANAGER,7839,1981/4/2,2975,,207654,MARTIN,SALESMAN,7698原创 2021-06-07 20:27:36 · 784 阅读 · 6 评论 -
hadoop学习整理——mapreduce数据分析案例(1)
有一份源数据文件,描述的是某餐饮公司各个分店在2019年和2020年的营业数据,源数据如下,请根据需求,编写MapReduce代码。劲松店,600,350,2019年劲松店,800,250,2020年王府井店,1900,600,2020年王府井店,2000,900,2019年回龙观店,6700,1800,2020年西单店,3000,1000,2019年西单店,5000,1000,2020年,3500,1000,2020年牡丹园店,3800,1400,2020年牡丹园店,原创 2021-06-07 18:03:27 · 3053 阅读 · 4 评论 -
大数据基础:HQL 入门必练50题_3
大数据基础:HQL 入门必练50题(31-50题)31、查询1990年出生的学生名单:--方法一:以出生时间前4位作为年过滤select sname,substr(sbirth,1,4) year from student group by sname,substr(sbirth,1,4)having year = 1990;--方法二:直接有year函数提取出生年过滤select sname,year(sbirth) year from student group by sname,year原创 2021-06-05 12:10:23 · 296 阅读 · 2 评论 -
大数据基础:HQL 入门必练50题_2
大数据基础:HQL 入门必练50题(16-30题)16、检索"01"课程分数小于60,按分数降序排列的学生信息:select t1.sid,sname,sbirth,ssex,t2.sscore from student t1inner join(select sid,sscore from score where cid = 1 and sscore < 60) t2on t1.sid = t2.sidorder by t2.sscore desc;17、按平均成绩从高到低显示所有学原创 2021-06-05 11:40:32 · 318 阅读 · 0 评论 -
大数据基础:HQL 入门必练50题_1
Hive sql入门必练50题原创 2021-06-03 16:04:09 · 473 阅读 · 0 评论