目录
原文大佬的这篇数据治理及数仓建设案例有借鉴意义,这里摘抄下来用作学习和知识沉淀。
一、数据治理背景
在数据仓库建设初期,翼支付主要面对以下几方面的问题:
(1)代码冗余,任务失效不稳定
祖传代码问题严重,任务链路长,存在大量烟囱式开发。另外由于没有统筹管理,资源任意抢占,使得任务时效得不到保障。
(2)元数据信息严重缺失
缺少元数据信息,没有明确的建表责任人,字段缺少中文备注,分区字段随意,一系列问题导致库表清理及新人上手难度大。
(3)数据安全风险高
敏感数据未加密,数据下载入口多,大量明细数据通过Tableau (BI工具)进行处理,无下载记录,数据安全风险非常高。
<