- 博客(12)
- 收藏
- 关注
原创 Hadoop生态系统-Hive
计算emp中除了CLERK岗位之外的剩余员工的每个部门的平均工资大于2000的部门和平均工资。dept中所有的数据 和 emp中与dept匹配的数据。emp所有的数据 和 dept中与emp匹配的数据。emp 和 dept 所有的数据(全外连接,满外连接)数据导入:将HDFS数据与hive的表映射。emp 和 dept共有的数据(内连接)计算emp每个部门中每个岗位的最高薪水。计算emp中每个部门中最高薪水的那个人。emp 和 dept 独有的数据。dept表独有的数据。
2023-03-14 21:20:10
325
原创 kafka是什么?
kafka是什么?概述Kafka是一个分布式的基于发布/订阅模式1(一对多)的消息队列2。读写速度快,吞吐量高,所以主要应用于大数据实时处理,比如秒杀场景。
2023-03-03 15:11:27
800
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人