SQL实现留存率计算

题目:现在运营想要查看用户在某天刷题后第二天还会再来刷题的留存率。请你取出相应数据。

SELECT COUNT(distinct q2.device_id,q2.date)/count(DISTINCT q1.device_id,q1.date) as avg_ret
#双重去重
FROM question_practice_detail as q1 
left outer join question_practice_detail as q2 #左连接
on q1.device_id=q2.device_id and DATEDIFF(q2.date,q1.date)=1#相差一天

1.表结构

示例:question_practice_detail

iddevice_idquestion_idresultdate
12138111wrong2021-05-03
23214112wrong2021-05-09
33214113wrong2021-06-15
46543111right2021-08-13
52315115right2021-08-13
62315116right2021-08-14
72315117wrong2021-08-15
83214112wrong2021-05-09
93214113wrong2021-08-15
106543111right2021-08-13
112315115right2021-08-13
122315116right2021-08-14
132315117wrong2021-08-15
143214112wrong2021-08-16
153214113wrong2021-08-18
166543111right2021-08-13

PG SQL是PostgreSQL数据库的简称,留存率是指用户在一段时间内仍然使用某个产品或服务的比例。PG SQL可以用来计算留存率,具体的代码实现如下: ``` -- 创建用户表 CREATE TABLE users ( user_id INTEGER, created_at TIMESTAMP, PRIMARY KEY (user_id) ); -- 创建活跃用户表 CREATE TABLE active_users ( user_id INTEGER, last_active TIMESTAMP, PRIMARY KEY (user_id) ); -- 计算留存率 WITH retention AS ( SELECT DATE_TRUNC('day', created_at) AS cohort_day, DATE_TRUNC('day', last_active) AS active_day, COUNT(DISTINCT users.user_id) AS cohort_size, COUNT(DISTINCT active_users.user_id) AS active_size FROM users JOIN active_users ON users.user_id = active_users.user_id WHERE created_at >= '2022-01-01' AND last_active >= '2022-01-01' GROUP BY 1, 2 ) SELECT cohort_day, active_day, cohort_size, active_size, ROUND(active_size::NUMERIC / cohort_size, 2) AS retention_rate FROM retention; ``` 以上代码中,首先创建了两个表:`users`表和`active_users`表。`users`表用于存储所有用户的信息,包括用户ID和创建时间;`active_users`表用于存储所有活跃用户的信息,包括用户ID和最后活跃时间。 接下来使用WITH语句计算留存率。首先按照创建日期和最后活跃日期对用户进行分组,统计每组中的用户数量和活跃用户数量。最后将结果按照日期和留存率进行输出。 如果你需要更加详细的介绍或者代码实现,请提供更加具体的问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值