题目
最近做了京东的24年春招题,题目如下:

题目分析
在这道题目中,我们需要从 play_record_tb 表中找出每个 cid 的最大峰值用户数(peak_uv),并按降序排列,最后输出前三个 cid。表结构如下:
cid:内容IDstart_time:播放开始时间end_time:播放结束时间
目标:找出每个 cid 的最大峰值用户数。
输出要求:输出 cid 和对应的最大峰值用户数,按降序排列,取前3个。
知识点关键词:自连接、条件聚合、分组、排序、限制输出
解答步骤
-
自连接计算重叠用户数
首先,我们需要通过自连接来计算每个
cid在任意时间段内的重叠用户数。通过自连接play_record_tb表,使用p1和p2两个别名,检查p1.start_time是否在p2.start_time和p2.end_time之间。表的连接及分组:
from play_record_tb p1
join play_record_tb p2 on p1.cid = p2.cid
group by p1.cid, p1.id
- 代码解释:将表格
play_record_tb

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



