rank,dense_rank,row_number,ntile区别和用法。

背景,忙完了。终于不用再赶了,自己在做项目中遇到的和当时迷惑的某些点,记录了一下,现在来做一个总结。
RANK() 排序相同时会重复,总数不会变。
DENSE_RANK()排序相同时会重复,总数会减少。 (dense:稠密的意思)

1建表
create table product_sell (
big_class string,
small_class string,
money double
) partitioned by (da string)
2插入数据
insert into product_sell partition (da=“201907”)
values
(“彩电”, “L55E5800A-UD”, 80),
(“彩电”, “L55V6500A-3D”, 90),
(“彩电”, “LSC550FN11-C”, 100),
(“冰箱”, “BCD-520WBEPF2”, 80),
(“冰箱”, “BCD-435WBEPIZ50”, 90),
(“冰箱”, “BCD-202U16”, 100),
(“空调”, “KFRd-35G/E012BpA”, 90),
(“空调”, “KFRd-26GW/DBp-XP21”, 100),
(“空调”, “KFR-35W/S13”, 100);
3.测试
3.1 RANK
查询本月个品类各型号销售额
select *, rank() over (partition by big_class order by money desc) from product_sell where da=“201907”;
在这里插入图片描述
分析看看:空调先并列第一,但没有第二直接到第三了。这个排序不太符合平常的查看习惯。如果出现并列最好后面的提到前面就好,这时就可以用dense_rank()
3.2dense_rank()在这里插入图片描述
dense,意思是稠密的,而rank()生成的排名序列中可能有空隙(可能是不连续的)。dense_rank()则是排序稠密的连续的
3.3row_number()
需求改了,

  1. 首先按照销售额排序
  2. 销售额相同的不要并列,而是再小品类排序
    在这里插入图片描述
    3.4 nticle :切片后的属于哪个切片的值
    在这里插入图片描述

4.总结
ntile/rank / dense_rank / row_number的语法都是一样的,都可以进行排序,不同的只是几个特性:
ntile :指的是将数据分几份,返回的份序列号。

  1. rank / dense_rank都考虑了并列的情况,所以序号可能不唯一,rank在出现并列之后会不连续,而dense_rank是连续的
  2. row_number不考虑并列的情况,所以序号是唯一的,并且也不会出现不连续。因此利用这个特性在给表去重和选择主键是可以用此种方法。这个在下面的文章中做介绍。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值