什么是数据治理?
百度百科解释:
数据治理(Data Governance)是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。
国际数据管理协会(DAMA)给出的定义:数据治理是对数据资产管理行使权力和控制的活动集合。
国际数据治理研究所(DGI)给出的定义:数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁(Who)能根据什么信息,在什么时间(When)和情况(Where)下,用什么方法(How),采取什么行动(What)。
数据治理的最终目标是提升数据的价值,数据治理非常必要,是企业实现数字战略的基础,它是一个管理体系,包括组织、制度、流程、工具。
个人理解:是企业内部由上而下,结合政策和技术对数据资产进行管理,目的是提升数据价值为企业服务。
数据治理的范围
数据治理项目的范围通常都会包含:组织建设、数据安全、数据开发、数据质量、元数据管理、数据价值等几个模块。
元数据管理
元数据从数据的角度可以分为三类:业务元数据、技术元数据和管理元数据。
- 业务元数据是从业务的视角去描述数据:表名称、表的血缘关系、表的字段说明、指标的统计口径等多种业务描述;
- 技术元数据从技术的角度去描述数据:表的sql、字段长度、字段类型、有效值、默认值等多种技术描述;
- 管理元数据是包含数据管理的信息在里面