数据平台的三大法宝

本文阐述了数据平台建设过程中的三个关键因素:指标、维度和模型。首先介绍了如何定义和迭代指标,接着讨论了维度如何使指标变得立体,并最后探讨了如何设计数据平台的模型。
部署运行你感兴趣的模型镜像

在数据平台的建设过程中,有诸多的要点,但有三个方面还是要单独拿出来说,因为他们实在是太重要了。指标、维度、模型我认为是数据平台建设的三大法宝。

  1. 指标第一
    数据平台的开始,是以整理指标和维度为先。
    (1)原始指标和聚合指标
    在我们定义指标时,要分清楚那些是原始指标,那些是聚合指标。
    业务上直接产生的数据就是原始指标;按照某个维度进行计算后的指标就是聚合指标。正常的顺序是先定义原始指标,再定义聚合指标。定义原始指标时,概念要清晰,例如:定义订单金额时,算不算邮费、算不算优惠等。定义聚合指标时,维度要清晰。
    以shareinstall为例,它是一款App渠道统计工具,围绕数据而生,它产生的指标如下,
    新增用户:第一次启动的用户,以设备作为判断标准;
    启动用户: 打开应用视为视为启动,完全退出或者后台运行超过30s后再次进入应用,视为新的启动;
    时段累计日活:启动过的应用的用户,启动过一次就视为活跃用户,包含新用户和老用户(这里指的时截止至各个整点时刻的当日活跃用户);
    累计用户:截止至目前所有启动过应用的独立用户数;
    活跃用户:启动过应用的用户,启动一次即视为活跃,包含新用户和老用户。
    (2)指标的迭代
    指标要跟着业务的发展进行迭代。我们应在数据平台建设的初期,建立好指标库,指标库尽量详尽和丰富。指标库是一个公司的公共概念,业务考核、产品迭代,都是以此为基准。
  2. 维度第二
    维度的存在,让指标变得更加立体,就像OLAP中的多维数据模型。事实上,维度的建设会比指标更加贴近业务,市场上的做电商的平台,可能大部分指标都是相同的,但每个平台一定会有一些特有的核心维度,这些特有的维度也恰恰定义了企业的商业模式。
    下面是一些梳理维度的思路:
    (1)显而易见的维度
    (2)与业务紧密相关的核心维度
    (3)业务发展过程中出现的动态维度
  3. 模型第三
    当我们建立好指标库和维度库后,接下来就是设计数据平台了。
    对于数据分析或者数据平台设计过程中的模型,其概念就是:经过实践、在一段时间内固化下来的数据分析的方法。

转载于:https://blog.51cto.com/13884603/2150629

您可能感兴趣的与本文相关的镜像

HunyuanVideo-Foley

HunyuanVideo-Foley

语音合成

HunyuanVideo-Foley是由腾讯混元2025年8月28日宣布开源端到端视频音效生成模型,用户只需输入视频和文字,就能为视频匹配电影级音效

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值