目录
1.概述
CDGP考试中,论述题和设计题共计60分,占总分比例较大。认真备考这些题型对通过考试极为重要。同时,多选题占30分,准备论述题的过程也能提升多选题成绩,因为答案大多来源于教材。
从DAMA官方消息来看,自今年6月份的认证考试起,将全面启用DMBOK2的修订版教材,考试内容也会相应调整。尽管目前提供的答案均基于当前版本的教材,但它们对于指导未来的考试仍具有一定的参考价值。考试的核心理念不会因教材版本的变化而大幅改变。因此,考生可以结合新版教材的内容,对原有回答进行适当替换和调整。
当然,我也会持续关注新版教材,深入了解其中新增的内容和考试动态,并与大家及时分享。
2.考题分析
1.1 度量指标
数据质量指标的高级分类包括哪些?并进行简要说明。
数据质量指标的高级分类包括:
1、投资回报率: 有关改进工作成本与改进数据质量的收益的说明
2、质量等级: 测量数据集之中或数据集之间错误或违反需求的数量和百分比
3、数据质量趋势:随时间推移达到阈值和目标的质量改进(即趋势),或每个时期的质量事件
4、数据问题管理指标:
①按数据质量维度对问题进行计数
②每个业务功能的问题及其状态(已解决、未解决、已升级)
③按优先级和严重性发布
④解决问题的时间
5、服务等级的符合性: 涉及的组织单位和负责人员,数据质量评估的项目干预措施,总体流程符合性
6、数据质量计划推广: 现状和扩展路线图
点评:数据质量的度量指标在相关知识体系中较为固定,基本源自教材原文。对于计划开展数据管理成熟度评估工作的从业者而言,这些指标具有重要参考价值。在量化管理级的评估环节中,它们能够作为有力的佐证材料,为评估结果提供支撑。
1.2 问题数据解决解方案
数据质量是数据管理的主要目的之一,提升数据质量涉及到很多方面,其中包括组织职责、人员匹配、领导重视程度、体系搭建、流程设置、绩效考核等。但是在这些事项中,问题数据解决和绩效考核至关重要,请您根据您所在企业的实际情况,设计问题数据解决解方案。
在数据管理体系中,问题数据解决是提升数据质量的关键环节。问题数据通常指的是不符合预期质量标准的数据,如重复数据、缺失数据、不一致数据、无效数据、异常数据等。
解决方案:
(1)问题数据定义及分类: 重复数据、缺失数据、不一致数据、无效数据、异常数据。
(2)组织职责与人员匹配: 数据质量管理小组、数据治理部门、业务部负责人
(3)问题发现和诊断流程: 数据质量检查、问题数据识别与标注、数据清洗与修复、问题数据修复和验证、数据质量报告与反馈。
点评:问题发现与诊断流程环环相扣,逻辑紧密,各个步骤间存在着清晰的递进关系,正因如此,该流程较为便于记忆。
1.3 数据质量问题的常见原因
什么问题导致数据质量低下?针对这些问题该采取什么措施?
导致数据质量低下的具体原因如下:
(1)缺乏领导力导致的问题(首要)
(2)数据输入过程引起的问题
(3)数据处理功能引起的问题
(4)系统设计引起的问题
(5)解决问题引起的问题
遇到数据质量问题可以采用鱼骨图进行根因分析,分析完成后通过PDCA解决问题,并根据数据质量报告验证数据质量是否得到提高。
点评:教材对数据质量问题的常见原因有详细的阐述。
1.4 数据质量的活动
数据质量低采取的措施?或数据质量工作的主要活动包括哪些?
1、定义高质量数据
2、定义数据质量战略
3、识别关键数据和业务规则
4、执行初始数据质量评估
5、识别改进方向并确定优先排序
6、定义数据质量改进目标
7、开发和部署数据质量工具
点评:DMBOK 语境关系图中所定义的各项活动,均为重点考查内容,考生务必牢记。鉴于即将发布的新教材对语境关系图进行了重新翻译与修订,为了紧跟考试动向,各位后续还需密切关注新教材的具体内容。
1.5 数据质量管理体系
(1)如何确定数据质量管理的优先级顺序?
(2)结合本公司实际情况按照(1)的顺序构建数据质量管理体系。
(1)数据质量管理应该从组织中最重要的数据入手。即质量更高,为组织及客户提供更多价值。可以根据监管要求、财务价值和对客户的直接影响等因素对数据进行优先级排序。
(2)构建数据质量管理体系的方法:根据数据的生命周期进行数据质量管理
规划:定义高质量数据的特征
设计&启用:定义系统和流程控制来规避数据问题产生,保持数据质量
创建/获取:测量或检查数据,确保数据满足质量要求
存储/维护:借助系统和流程检测数据,确保数据能够持续的满足期望
使用:使用反馈循环机制来持续提升数据的质量
增强:就数据质量提升机会采取行动
处置:基于数据质量要求正确地识别和提升数据
点评:在数据质量管理工作中,应依据一定标准确定其优先级,即从最为关键的数据着手。具体而言,需着重考量监管要求、财务价值以及给客户带来的直接影响等方面。
3.总结
这一篇包含 5 个论述题,在对这包含5个论述题的相关内容进行梳理时,若从其内在的逻辑关联角度出发,我觉得可以将其划分为以下几个部分:数据质量问题的常见成因、针对问题数据的有效解决策略、构建完善的数据质量管理体系、围绕数据质量开展的相关活动以及数据质量度量指标。大家在学习过程中,可采用理解性记忆的方法来加深对这些内容的掌握。
648

被折叠的 条评论
为什么被折叠?



