[hiveSQL面试题4]

该博客主要围绕Hive SQL进行超前点播数据分析,包括统计每日购买笔数、金额、人数及新老用户,计算忠实与普通用户的平均购买集数,以及分析用户最大连续追剧天数的用户分布。内容涵盖视频应用的用户行为分析和指标体系设计。


背景说明:
用户在腾讯视频APP观看超前点播视频需付费购买,生成相应的购买流水表 (每次购买均对应一笔流水),表名为:cover_pay_flow。有以下字段信息:
imp_date:数据日期
ftime:购买时间(yyyy-MM-dd hh:mm:ss)
feq_no:流水号
user_id:账号
cid:专辑ID(电视剧ID)
vid:视频id(具体集ID)
fee:金额(分)

表格信息如下:
在这里插入图片描述
某电视剧(cid = ‘vbb35hm6m6da1wc’)排播周期如下:
超前点播周期为2019-12-23至2020-01-08,每天更新2集,合计更新32集。

(1)请统计超前点播期间,每日购买笔数、总金额、购买人数以及相应的新、老用户数;

注:当日为该剧首次购买,即为新用户
要求输出结果如下:
在这里插入图片描述

sql

(2)一个用户购买超前点播剧集集数的35%即为该剧忠实用户,其余为普通用户。请统计忠实与普通用户的平均购买集数 。

要求输出结果如下:
在这里插入图片描述

sql

(3)一个用户从第一次购买该剧开始,每天都购买或者未购买天数不超过1天,均视为连续追剧。未购买天数超过1天的均视为中断,需要重新统计连续追剧日期。请统计购买该剧超前点播的用户,最大的连续追剧天数,并按照最大连续追剧天数统计对应的用户数分布。

举例:
在这里插入图片描述
要求输出结果如下:
在这里插入图片描述

sql

背景说明:
腾讯视频新开发了一款针对少儿的视频APP:小企鹅乐园,作为数据分析人员,请你为小企鹅乐园设计合适的指标体系,并描述如何实现指标体系的落地。

本人的方案被说不是最优,所以删掉了,大神们可以评论区给出最优方案交流交流。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值