今天来介绍数据中台的第二篇,第二篇共分为三个大部分分别对应的是阿里的数据中台三大体系(阿里的数据中台体系架构见上一篇),OneData体系,OneEntity体系,OneService体系,三大体系相辅相成、相互依赖,OneData体系为基础。这次我们把OneData体系分为两部分介绍,因为OneData体系包括数据模型设计和数据资产管理两部分,今天我们介绍OneData的数据模型篇章。
1. 烟囱式开发带来的困扰和资源浪费
阿里的数据中台治理主要是在2014年开始的,在2014年以前,阿里的大数据建设处于烟囱式开发状态,这样的开发带来了许多业务的困扰和资源的浪费,2014数据依赖如下图
由图可见
数据流向会乱,无方向性的
数据管理式无序的,处于失控状态
除了浪费研发人力和计算存储资源、也必然满足不了业务的需求
当然,这个问题被放大式在本身业务以极快的速度发展的前提下,这样的开发导致的问题我们从两个方面来看
业务困扰
在混乱的开发中,会造成诸多的数据问题,如因为指标的定义问题,导致同一指标有多个数据,最常见的指标为UV,总结最业务的困扰主要一下三点
数据统一:数据标准规范难(命名不规范、口径不统一、算法不一致),数据任务响应慢,从而导致业务部门产生困扰而导致不满
数据未打通:各个数据团队各自为政,存在严重的数据孤岛现状;缺乏数据融通,数据价值发掘不够,从而导致业务部门看不清数据
成为成本中心且服务化不足:数据无方向性,依赖混乱,,数据
本文介绍了阿里数据中台的OneData体系,特别是数据模型设计部分,探讨了烟囱式开发的问题,如数据流向混乱、资源浪费,并提出了数据公共层建设的必要性。OneData体系包括规范化数据建模、研发工具、数据模型数据小库和面向应用的数据监控四部分,旨在解决数据标准、资源浪费和技术维护等问题。通过数据规范定义和数据模型设计,实现数据仓库规划和统一标准,确保数据口径一致和计算粒度明确。
订阅专栏 解锁全文
7万+

被折叠的 条评论
为什么被折叠?



