大数据面试题

一.SQL 

1、查询出每门课程的及格人数和不及格人数

2、使用分段[100-80],[80-60][‹60]来统计各科成绩,分别统计:各分数段人数,课程号和课程名称

3、下面是学生的成绩表(表名score,列名:学号、课程号、成绩)

5.查询没有学全所有课的学生的学号、姓名

6.查询两门以上不及格课程的同学的学号及其平均成绩

二、Hadoop

1、hadoop数据倾斜如何处理

2、Hadoop性能调优

 3、hadoop常见的join

 

  

三、hive 

1、 hive中两个大表实现join操作,简单描述。

 2、 hive中排序关键字有哪些? 

3、 hive数据倾倾斜,如何处理?

 四、Spark

 1、RDD机制以及存储级别?

 2、 检查点机制 

 3、 Spark 的工作流程

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值