hive 留存率 计算

本文介绍了如何在Hive中计算用户留存率,包括一日、三日和七日留存率的定义、建表和查询方法。通过对register_tbl和active_tbl表进行左关联,筛选出在特定日期范围内的注册用户,并按用户和注册日期分组,计算留存用户数量及比例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

定义

留存率:某日注册的用户,在之后几天是否活跃,一日留存率就是用户注册后第二天仍然活跃,以此类推,三日留存率,七日留存率。
任务:
计算所有用户注册后的一日留存率,三日留存率和七日留存率。

建表

use default;
show tables;

create table register_tbl(
user_id string,
register_date string)
row format delimited fields terminated by ',' 
location "/HiveTestDB/retention/re"
tblproperties("skip.header.line.count"="1");

create table active_tbl(
user_id string,
active_date string)
row format delimited fields terminated by ',' 
location "/HiveTestDB/retention/ac"
tblproperties(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值