任务|表|字段
数据资产很核心的就是对任务、表、字段做管理以及服务
首先我们要标记出来核心资产。最核心的数仓中间层所涉及到的表,这些表、字段、任务(任务中包含很多加工逻辑,这里面包含了很多业务知识,业务策略)都是公共的公用的,对整个业务都有很大作用的。比如说以下很多核心字段。
任务:关键节点,比如当这个任务挂了,下游很多都会受到影响。核心业务逻辑:任务之所以把它列为核心资产也是因为任务中包含很多逻辑,这些逻辑隐含了很多知识,如果丢失了会造成很多问题。
标记的方式
自动识别:可以通过数据的使用情况,比如我这个表下游有很多依赖,下游很多数据都使用这个表的数据。以及每天使用频次频率非常多。也就是说,可以根据使用情况自动给表打标签。
监控
并不需要对所有的数据进行监控,因为没有那么大的资源。