经网友确认出的是原题,好好准备(本人过 ,一题力扣原题)

平移函数:在工作中一般用来实现数据的同比和环比的计算
同比:今年的4月和去年的4月相比,在两个时间范围内,取相同时间节点的数据进行比较
环比:今年的4月和今年的3月相比,在同一个时间范围内,取相邻的时间节点的数据进行比较
lag() 将数据往下平移一行
lead() 将数据往上平移一行
LeetCode原题
SELECT distinct num ConsecutiveNums FROM (SELECT num ,(row_number() over(order by id)-ROW_NUMBER() over(PARTITION by num ORDER BY id) ) tu FROM logs ) ty GROUP BY num,tu HAVING COUNT(tu )>=3

hive有中位数函数yyds比关系型数据库简单
percentile:percentile(col, p) col是要计算的列(值必须为int类型),p的取值为0-1,若为0.5,那么就是2分位数,即中位数。
补充问题4 题目产品表数据量1000W 意在考查大小表关联,产生的数据倾斜
文章介绍了平移函数lag()和lead()在处理同比和环比计算中的作用,以及如何使用它们进行数据对比。同时提到了LeetCode中的一道相关题目,并指出Hive数据库中的percentile函数可以方便地计算中位数,对于处理大规模数据(如1000W条的产品表)时的数据倾斜问题也进行了讨论。
6050





