数仓指标架构设计——以内容产品为例

最新推荐文章于 2025-04-13 00:34:23 发布

原创

最新推荐文章于 2025-04-13 00:34:23 发布 · 1.5k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#big data #大数据 #数据仓库

本文探讨了内容产品数仓指标架构设计的问题与设计目标，包括统一指标管理、业务和技术目标。介绍了从业务线到数据仓库模型的设计，强调了业务域、度量、维度、修饰词等概念，并详细阐述了ODS到ADS各层模型的功能和命名规范，旨在实现数据的管理、追溯和避免重复建设。

1 问题与设计目标

主要从业务、技术、产品三个视角来看，目前存在和可能引起的问题：

业务视角业务分析场景指标、维度不明确；频繁的需求变更和反复迭代，数据报表臃肿，数据参差不齐；用户分析具体业务问题找数据、核对确认数据成本较高。
技术视角指标定义，指标命名混乱，指标不唯一，指标维护口径不一致；指标生产，重复建设；数据汇算成本较高；指标消费，数据出口不统一，重复输出，输出口径不一致；
产品视角缺乏系统产品化支持从生产到消费数据流没有系统产品层面打通；

管理目标

技术目标统一指标和维度管理，指标命名、计算口径、统计来源唯一，维度定义规范、维度值一致
业务目标统一数据出口、场景化覆盖
产品目标指标体系管理工具产品化落地；指标体系内容产品化落地支持决策、分析、运营例如决策北极星、智能运营分析产品等

2 数仓指标架构设计

从业务架构设计到模型设计，从数据研发到数据服务，做到数据可管理、可追溯、可规避重复建设。

数据指标模型架构

2.1 业务线

业务板块定义原则：业务逻辑层面进行抽象、物理组织架构层面进行细分，可根据实际业务情况进行层级分拆细化，层级分级建议进行最多进行三级分拆，一级细分可公司层面统一规范确定，二级及后续拆分可根据业务线实际业务进行拆分。

规范定义

以维度建模作为理论基础，构建总线矩阵，定义业务域、数据域、业务过程、度量/原子指标、维度、维度属性、修饰词、修饰类型、时间周期、派生指标等。

业务域

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。