hive窗口函数over()

本文详细介绍了Hive中的窗口函数over()的使用,包括不分区全量窗口、分区窗口、排序窗口、lag()函数、ntile()函数以及rank()函数的应用场景和示例,帮助理解如何在数据处理中灵活运用这些函数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

hive窗口函数over()

over(),指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变而变化。
根据尚硅谷大数据Hive教程,总结整理

(1)over() group by,给每一条数据都开全量窗口

原数据

在这里插入图片描述
需求:查询在 2017 年 4 月份购买过的顾客及总人数

  • 1)查询在 2017 年 4 月份购买过的所有字段
    substring(string A, int start, int len):从0开始,截取字符串
    在这里插入图片描述
  • 2)–查询在 2017 年 4 月份购买过的顾客
    在这里插入图片描述
  • 3)2017 年 4 月份购买过的总人数
    在这里插入图片描述
    • 需求是,既要人名又要总数,
      (可以把两个sql查出的数据,做笛卡尔积,join,不靠谱)
      在这里插入图片描述在这里插入图片描述
      (该sql含义为,每个人在4月的购买次数,不是我们的需求人数,不符合。)
  • 在上面的sql中,只加一个over(),就可以达到目的,over()在group by函数后生效。
    意思为,count(*)是在over()窗口中进行,over()窗口中没写东西,则 所有数据
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值