文章目录
什么是指标
数据团队出具的一个统计报表字段即为指标。比如最近七天的订单量,一个促销活动的购买转化率等等。
一个指标具体到计算实施,主要有以下几部分组成
- 指标加工逻辑,比如count ,sum, avg
- 维度 比如按部门、地域进行指标统计,对应sql中的group by
- 业务限定/修饰词 比如以不同的支付渠道来算对应的指标,微信支付的订单退款率,支付宝支付的订单退款率 。对应sql中的where
除此之外,指标本身还可以衍生、派生出更多的指标,基于这些特点,可以将指标进行分类
- 原子指标 基本业务事实,没有业务限定、没有维度。比如订单表中的订单量、订单总金额都算原子指标
- 派生指标 比如过去5天的订单总金额,就是加了业务时间限定
- 衍生指标 比如某一个促销活动的转化率,就需要
促销投放人数指标同促销订单数指标进行计算得出
指标系统建设前的状况
- 不知道口径,数据平台出去的指标,用户甚至数据研发自己都不知道具体的口径,需要翻代码
- 指标耦合,不方便下线和口径调整,现有报表都是需求驱动,一个sql中可能对应了多个指标的计算,导致指标下线,逻辑调整都要相互影响
- 指标重复计算,不同报表用到同一个指标,需要重复的写同样的逻辑,加重集群的计算压力,且指标口径一调整,需要多处调整
- 指标血缘无法跟踪,数据团队交付的报表时间久了不知道谁提的,不知道用到了哪些表,不知道最终被用到了哪些团队
- 只见树木,不见森林。数据团队花了大量时间在报表开发上,而忽略了底层模型的打磨
指标建设的宏观步骤
基于业务目的梳理指标体系
基于公司不同的业务模块,业务场

本文介绍了指标管理系统的构建,包括指标的定义、系统建设前的状况、建设步骤和产品模块设计。系统旨在解决指标口径不明、耦合、重复计算等问题,提供指标定义录入、血缘跟踪、下线管理等功能。技术实现涉及指标加工逻辑的自动化和指标输出设计,以支持数据仓库中的指标计算和管理。
最低0.47元/天 解锁文章
3736

被折叠的 条评论
为什么被折叠?



