今天介绍OneData体系的第二部分,这部分主要的内容是从成本中心向资源中心转变的一个过程。这个过程的主要内容是有元数据做底层构建的。核心思想是将存储和计算成本与数据的价值挂钩,形成数据资产的概念。简单的理解可以使价值/成本。本章的介绍方式还是先讲问题,再讲方法。本人公司也是在业务发展速度较快期,数据成本问题非常突出。那么开始本次介绍
1. 数据成本的深渊
首先介绍的是因为数据公共层建设不完善导致的ODS层数据重复抽取,在ODS层,DWD层,因为都是明细数据,所以占用的存储非常大。
其次,也是最终要的方法,将存储作为成本来看。很长的时间人们对于大数据的概念就是:空值成本、梳理血缘。一个重要的转变就是将成本投入与数据应用产生的价值挂钩的投入产出比,更值得去关注,从成本走向资产,从而直接对标价值,这是数据人在大数据赋能业务的过程中的终极目标
最后,将人肉治,转换为产品治,是在数据管理中孜孜不倦追求的目标。
综合以上的三点,看出资产治理的必要性和核心,而阿里走向数据资产治理的过程是从
1. 存储治理
2. 资源治理
3. 数据资产管理
2. 发展过程
2.1 存储治理
这里没有什么需要明确说的,是在数据仓库重构的时候,配合进行的。具体内容在图片中都有展示,这里不是重点