-
数据治理定义
国际数据管理协会(DAMA)给出的定义:数据治理是对数据资产管理行使权力和控制的活动集合。
国际数据治理研究所(DGI)给出的定义:数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁(Who)能根据什么信息,在什么时间(When)和情况(Where)下,用什么方法(How),采取什么行动(What)。
数据治理的最终目标是提升数据的价值,数据治理非常必要,是企业实现数字战略的基础,它是一个管理体系,包括组织、制度、流程、工具。 -
数据质量管理(Data Quality Management)
是指对数据从【计划、获取、存储、共享、维护、应用、消亡】生命周期的每个阶段里可能引发的各类数据质量问题,进行【识别、度量、监控、预警】等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。 -
质量评估
由于数据清洗(DataCleaning)工具通常简单地被称为数据质量(Data Quality)工具,其实数据清洗只是数据质量管理中的一步。数据质量管理(DQM),不仅包含了对数据质量的改善,同时还包含了对组织的改善。
针对数据的改善和管理,主要包括【数据分析、数据评估、数据清洗、数据监控、错误预警】等内容;
针对组织的改善和管理,主要包括【确立组织数据质量改进目标、评估组织流程、制定组织流程改善计划、制定组织监督审核机制、实施改进、评估改善效果】等多个环节。 -
任何改善都是建立在评估的基础上,知道问题在哪才能实施改进。通常数据质量评估和管理评估需通过以下几个维度衡量。
-
数据质量评估
完整性 Completeness:完整性用于度量哪些【数据丢失】了或者哪些【数据不可用】。
规范性 Conformity:规范性用于