1.1 离线数仓-指标体系分析

本文深入探讨了离线数据仓库中的指标体系,分析了包括最近1/7/30日各渠道访客数、会话平均停留时长等关键指标的拆解与计算方法,涉及原子指标、派生指标和衍生指标的概念,以及统计周期、业务限定和统计粒度的定义。

前言

前面对数据仓库的设计过程进行了了解,这里对数仓的指标体系进行分析。

一、最近1/7/30日各渠道访客数

在这里插入图片描述
原子指标=业务过程+度量值+聚合逻辑
派生指标=原子指标+统计周期+业务限定+统计粒度
以这个作为第一个例子进行分析:
       第一步,最近1/7/30日各渠道访客数明显是一个需求,是不需要依赖于其他指标的,所以是派生指标
       第二步,对派生指标进行拆分,它的原子指标是访客个数,它的统计周期是最近1/7/30日,它的业务限定无,它的统计粒度是渠道
       第三步,对原子指标进行拆分,访客个数(不是访问次数)的业务过程是页面浏览,它的度量值是mid_id,它的聚合逻辑是count(distinct())

二、最近1/7/30日各渠道会话平均停留时长

在这里插入图片描述

原子指标=业务过程+度量值+聚合逻辑
派生指标=原子指标+统计周期+业务限定+统计粒度
衍生指标依赖于一个或多个派生指标
以这个作为第一个例子进行分析:
       第一步,最近1/7/30日各渠道访客数明显是一个需求,是不能够直接一步计算得到的,需要依赖于其他指标,所以是衍生指标
       第二步,对衍生指标,它要求平均停留时长,所以要依赖于总的停留时长(派生指标),它的逻辑是avg()
       第三步,对最近1/7/30日各渠道会话总停留时长派生指标进行拆分,它的原子指标是浏览时长,它的统计周期是最近1/7/30日,它的业务限定无,它的统计粒度是渠道和会话
       第四步,对浏览时长这个原子指标进行拆分,它的业务过程是浏览页面,它的度量值是during_time,聚合逻辑是sum()

三、最近1/7/30日各渠道总会话数

在这里插入图片描述

四、最近1/7/30日各渠道跳出率

在这里插入图片描述

五、最近1/7/30日页面浏览路径分析(各跳转次数)

在这里插入图片描述

六、流失用户数

在这里插入图片描述

七、流失用户数

在这里插入图片描述

八、用户新增留存率

在这里插入图片描述

九、最近1/7/30日新注册用户数

在这里插入图片描述

十、最近1/7/30日活跃用户数

在这里插入图片描述
后面还有许多,主要掌握的是指标体系的分析方法…

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值