在数据平台的建设过程中,有诸多的要点,但有三个方面还是要单独拿出来说,因为他们实在是太重要了。指标、维度、模型我认为是数据平台建设的三大法宝。
- 指标第一
数据平台的开始,是以整理指标和维度为先。
(1)原始指标和聚合指标
在我们定义指标时,要分清楚那些是原始指标,那些是聚合指标。
业务上直接产生的数据就是原始指标;按照某个维度进行计算后的指标就是聚合指标。正常的顺序是先定义原始指标,再定义聚合指标。定义原始指标时,概念要清晰,例如:定义订单金额时,算不算邮费、算不算优惠等。定义聚合指标时,维度要清晰。
以shareinstall为例,它是一款App渠道统计工具,围绕数据而生,它产生的指标如下,
新增用户:第一次启动的用户,以设备作为判断标准;
启动用户: 打开应用视为视为启动,完全退出或者后台运行超过30s后再次进入应用,视为新的启动;
时段累计日活:启动过的应用的用户,启动过一次就视为活跃用户,包含新用户和老用户(这里指的时截止至各个整点时刻的当日活跃用户);
累计用户:截止至目前所有启动过应用的独立用户数;
活跃用户:启动过应用的用户,启动一次即视为活跃,包含新用户和老用户。
(2)指标的迭代
指标要跟着业务的发展进行迭代。我们应在数据平台建设的初期,建立好指标库,指标库尽量详尽和丰富。指标库是一个公司的公共概念,业务考核、产品迭代,都是以此为基准。 - 维度第二
维度的存在,让指标变得更加立体,就像OLAP中的多维数据模型。事实上,维度的建设会比指标更加贴近业务,市场上的做电商的平台,可能大部分指标都是相同的,但每个平台一定会有一些特有的核心维度,这些特有的维度也恰恰定义了企业的商业模式。
下面是一些梳理维度的思路:
(1)显而易见的维度
(2)与业务紧密相关的核心维度
(3)业务发展过程中出现的动态维度 - 模型第三
当我们建立好指标库和维度库后,接下来就是设计数据平台了。
对于数据分析或者数据平台设计过程中的模型,其概念就是:经过实践、在一段时间内固化下来的数据分析的方法。
转载于:https://blog.51cto.com/13884603/2150629
本文阐述了数据平台建设过程中的三个关键因素:指标、维度和模型。首先介绍了如何定义和迭代指标,接着讨论了维度如何使指标变得立体,并最后探讨了如何设计数据平台的模型。
1581

被折叠的 条评论
为什么被折叠?



