离线数仓-指标体系分析
前言
前面对数据仓库的设计过程进行了了解,这里对数仓的指标体系进行分析。
一、最近1/7/30日各渠道访客数

原子指标=业务过程+度量值+聚合逻辑
派生指标=原子指标+统计周期+业务限定+统计粒度
以这个作为第一个例子进行分析:
第一步,最近1/7/30日各渠道访客数明显是一个需求,是不需要依赖于其他指标的,所以是派生指标
第二步,对派生指标进行拆分,它的原子指标是访客个数,它的统计周期是最近1/7/30日,它的业务限定无,它的统计粒度是渠道
第三步,对原子指标进行拆分,访客个数(不是访问次数)的业务过程是页面浏览,它的度量值是mid_id,它的聚合逻辑是count(distinct())
二、最近1/7/30日各渠道会话平均停留时长

原子指标=业务过程+度量值+聚合逻辑
派生指标=原子指标+统计周期+业务限定+统计粒度
衍生指标依赖于一个或多个派生指标
以这个作为第一个例子进行分析:
第一步,最近1/7/30日各渠道访客数明显是一个需求,是不能够直接一步计算得到的,需要依赖于其他指标,所以是衍生指标
第二步,对衍生指标,它要求平均停留时长,所以要依赖于总的停留时长(派生指标),它的逻辑是avg()
第三步,对最近1/7/30日各渠道会话总停留时长派生指标进行拆分,它的原子指标是浏览时长,它的统计周期是最近1/7/30日,它的业务限定无,它的统计粒度是渠道和会话
第四步,对浏览时长这个原子指标进行拆分,它的业务过程是浏览页面,它的度量值是during_time,聚合逻辑是sum()
三、最近1/7/30日各渠道总会话数

四、最近1/7/30日各渠道跳出率

五、最近1/7/30日页面浏览路径分析(各跳转次数)

六、流失用户数

七、流失用户数

八、用户新增留存率

九、最近1/7/30日新注册用户数

十、最近1/7/30日活跃用户数

后面还有许多,主要掌握的是指标体系的分析方法…
本文深入探讨了离线数据仓库中的指标体系,分析了包括最近1/7/30日各渠道访客数、会话平均停留时长等关键指标的拆解与计算方法,涉及原子指标、派生指标和衍生指标的概念,以及统计周期、业务限定和统计粒度的定义。
1835

被折叠的 条评论
为什么被折叠?



