易忘知识点

本文深入探讨了大数据处理中的开窗函数,包括其语法、分类及应用场景,如排名和聚合函数。同时,详细介绍了Sqoop的使用,如参数配置和常见问题,帮助理解数据导入导出过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

开窗函数:

以序号排序的方式就使用开窗函数
开窗函数与聚合函数计算方式一样,开窗函数也是对行集组进行聚合计算,但是它不像普通聚合函数那样每组只返回个值,开窗函数可以为每组返回多个值。
开窗函数的语法为:over(partition by 列名1 order by 列名2 ),括号中的两个关键词partition by 和orderby 可以只出现一个。over() 前面是一个函数,如果是聚合函数,那么order by 不能一起使用。
开窗函数主要分为以下两类:
窗口函数OVER()指定一组行,开窗函数计算从窗口函数输出的结果集中各行的值。
开窗函数不需要使用GROUP BY就可以对数据进行分组,还可以同时返回基础行的列和聚合列。
1.排名开窗函数
ROW_NUMBER、DENSE_RANK、RANK属于排名函数。
排名开窗函数可以单独使用ORDER BY 语句,也可以和PARTITION BY同时使用。
PARTITION BY用于将结果集进行分组,开窗函数应用于每一组。
ORDER BY 指定排名开窗函数的顺序,在排名开窗函数中必须使用ORDER BY语句。
ROW_NUMBER()为每一组的行按顺序生成一个连续序号。
RANK()也为每一组的行生成一个序号,与ROW_NUMBER()不同的是如果按照ORDER BY的排序,如果有相同的值会生相同的序号,并且接下来的序号是不连序的。例如两个相同的行生成序号2,那么接下来会生成序号4。
DENSE_RANK()和RANK()类似,不同的是如果有相同的序号,那么接下来的序号不会间断。也就是说如果两个相同行生成序号2

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值