- 博客(3)
- 收藏
- 关注
原创 Hive SQL 多日留存计算
一、需求留存、留存率是用于反映网站、互联网应用或网络游戏等运营情况的统计指标,因此计算留存、留存率是数据分析及数据工程师是常见的需求。对于求单日的1日、2日、3日、7日等留存指标,相对较为简单;对于分析一段时间内的留存情况,求一段时间内的各日的1日、2日、3日等留存,较为复杂。二、问题分析1.测试数据情况。测试数据包括三个字段,用户id,用户注册日期,用户登陆日期(活跃日期)。测试数据在天粒度已去重。2.求解分析留存:注册用户在N日后的活跃(登录)用户...
2021-10-24 16:56:25
1938
原创 Hive_SQL 一次删除多个分区数据
目录1.删除语法2.元数据及数据存储变化3.示例3.1 单个分区字段表3.1.1 删除单个分区单个分区数据3.1.2 删除单个分区字段多个分区数据3.2多个分区字段表3.2.1 删除多个分区字段 单个分区数据3.2.2 删除多个分区字段 单个字段 多个分区范围数据3.2.3删除多个分区字段 多个字段 多个分区范围数据1.删除语法ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition...
2021-10-16 09:35:55
22239
2
原创 SQL 求用户的连续登陆天数
一、题目描述求解用户登陆信息表中,每个用户连续登陆平台的天数,连续登陆基础为汇总日期必须登陆,表中每天只有一条用户登陆数据(计算中不涉及天内去重)。表描述:user_id:用户的id; sigin_date:用户的登陆日期。二、解法分析注:求解过程有多种方式,下述求解解法为笔者思路,其他解法可在评论区交流。思路: 该问题的突破的在于登陆时间,计算得到连续登陆标识,以标识分组为过滤条件,得到连续登陆的天数,最后以user_id分组,以...
2021-10-07 23:55:02
2756
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人