目录
0.概述
DMBOK2第十三章主要讲述了数据质量相关的内容。这一章首先对高质量数据需求的必要性进行强调,认为高质量数据是发挥数据价值的必要前提。接着对数据质量管理的常见驱动因素和原则进行总结,并对数据管理中的重要概念进行解释,如数据质量、数据质量核心维度、数据质量管理流程等。然后,对数据质量管理活动的流程进行分步分析,并对其中用到的方法和工具进行总结。最后,对整个活动的实施评估和企业组织的数据文化变革进行阐述。
1.数据质量管理活动
1、定义高质量数据。
2、定义数据质量战略。
3、识别关键数据和业务规则。
①识别关键数据。
②识别已有的规则和模式。
4、执行初始数据质量评估。
①确定问题并排定优先顺序。
②执行问题根本原因分析。
5、识别改进方向并确定优先排序。
①根据业务影响确定行动的优先级。
②制定预防和纠正措施。
③确认计划的行动。
6、定义数据质量改进目标。
7、开发和部署数据质量操作。
①管理数据质量规则。
②测量和监控数据质量。
③制定管理数据质量问题的操作过程。
④制定数据质量服务水平协议。
⑤编写数据质量报告。
2.企业关键数据
1、监管报告。
2、财务报告。
3、商业政策。
4、持续经营。
5、商业战略,尤其是差异化的竞争战略。
从企业角度来看,需要关注的关键数据包括上述提到的内容。而从个人角度来看,关键数据主要包括个人信息、个人财务、个人健康和教育记录等四个方面。
这个地方还引申出一个知识点:在哪些行业中,监管被放在首位。答案通常是金融行业和医疗卫生行业。这一点在CDGA考试中有时会被提及。
3.数据质量领域三个最具影响力人物
1、Strong-Wang
2、Thomas Redman
3、Larry English
CDGA的一些考题有时会问到这个知识点。
4.戴明环(PDCA)
计划(P)-执行(D)-检查(C)-行动(A)
PDCA新周期开始于
1、现有测量值低于阈值。
2、新数据集正在调查中。
3、对现有数据集提出新的数据质量要求。
4、业务规则、标准或期望变更。
5.数据质量问题常见的原因,如何提高数据质量
1、缺乏领导力导致的问题。
采取的措施:
①提高领导和员工的数据质量意识。
②完善数据治理。
③提高领导力和管理能力。
④证明改进的合理性。
⑤使用合适的价值测量工具
2、数据输入过程引起的问题。
采取的措施:
①数据输入接口增加编辑或控件,防止不正确的数据被录入系统。
②及时更新数据模型和用户界面,防止字段重载。
③开展培训,提高数据处理人对错误数据影响的认识,保证数据的准确性。
④业务规则发生更改应及时全面的纳入系统,及时升级相关接口以适应新的需求,防止出现数据错误,在整个系统中宣导业务规则的改变。
3、数据处理功能引起的问题。
采取的措施:
①严格执行变更流程管理,防止出现错误变更、系统文档不完整或过时、知识转移不充分的情况。
②定期对业务规则进行审查和更新。
③源系统变更时及时通知下游消费者响应变更。
4、系统设计引起的问题。
采取的措施:
①强制执行参照完整性,确保应用程序或系统级别的高质量数据。
②执行唯一性约束。
③提高编码的准确性。
④提高数据模型的准确性。
⑤防止字段重载。
⑥确保时间数据匹配。
⑦提高主数据管理能力,选择可靠的数据源。
⑧避免不必要的、有害的数据复制。
5、解决问题引起的问题。
采取的措施:
避免通过手动数据修复直接对数据库中的数据进行修改,而是通过应用接口或业务处理规则进行更改实现。所有的更改都应通过一个受控的变更管理过程实现。
CDGP考试在本章很有可能出论述题,让考生回答如何提高数据质量。以上内容一定要牢记。
6.数据质量维度
准确性、完备性、一致性、完整性、合理性、及时性、唯一性、有效性。
以上是DMBOK中提到的常见数据质量维度。CDPA考试的一些题目有时会涉及这些内容。考生可以了解教材中对这些质量维度的描述。
7.其他
1.数据质量工具
(1)数据剖析和查询工具。
(2)数据质量规则模板。
(3)质量检查和审计代码模块。
(4)元数据存储库。
2.数据质量度量指标
(1)投资回报。
(2)质量水平。
(3)数据质量趋势。
(4)数据问题管理指标。
(5)服务水平的一致性。
(6)数据质量计划示意图。现状和扩展路线图。

被折叠的 条评论
为什么被折叠?



