4 执行初始数据质量评估

4 执行初始数据质量评估

一旦确定最关键的业务需求和支持它们的数据,数据质量评估的最

重要部分就是实际查看数据、查询数据,以了解数据内容和关系,以及

将实际数据与规则和期望进行比较。第一次这样做时,分析人员会发现

许多事情:数据中未被记录的依赖关系、隐含规则、冗余数据、矛盾数

据等,当然还有实际符合规则的数据。在数据管理专员、其他领域专家

和数据消费者的帮助下,数据治理分析人员需要对调查结果进行分类并

确定其优先级。

初始数据质量评估的目标是了解数据,以便定义可操作的改进计

划。通常最好从聚焦一项较小工作开始——一个基本的概念证明

Proof of Concept,POC)——来演示改进过程是如何工作的。步骤包

括:

1)定义评估的目标。这些目标将推动工作进展。

2)确定要评估的数据。重点应放在一个小的数据集,甚至一个数

据元素,或一个特定的数据质量问题上。

3)识别数据的用途和数据的使用者。

4)利用待评估的数据识别已知风险,包括数据问题对组织过程的

潜在影响。

5)根据已知和建议的规则检查数据。

6)记录不一致的级别和问题类型。

7)根据初步发现进行额外的深入分析,以便:

①量化结果。

②根据业务影响优化问题。

③提出关于数据问题根本原因的假设。

8)与数据管理专员、领域专家和数据消费者会面,确认问题和优

先级。9)使用调查结果作为规划的基础。

①解决问题,最好是找到问题的根本原因。

②控制和改进处理流程,以防止问题重复发生。

③持续控制和汇报。

13.2.5 识别改进方向并确定优先排序

在证明改进过程可行后,下一个目标是策略性地应用它。要做到这

一点,需要识别潜在的改进措施,并确定其优先顺序。识别可以通过对

较大数据集进行全面的数据分析来完成,以了解现有问题的广度;也可

以通过其他方式实现,如就数据的影响问题与利益相关方进行沟通,并

跟踪分析这些问题的业务影响。最终,需要结合数据分析人员以及利益

相关方的讨论排定最终优先顺序。

执行全面的数据剖析和分析的步骤基本上与执行小规模评估的步骤

相同:定义目标、了解数据使用和风险,根据规则衡量、记录并与领域

专家确认结果,利用这些信息确定补救和改进工作的优先级。然而,有

时也需要全面分析存在技术方面的障碍。如果要制订有效的行动计划,

则需要在一个分析团队中协调这项工作,并总结和理解总体结果。像小

规模的剖析工作一样,大规模的剖析工作仍然应该集中在最关键的数据

上。

剖析数据只是分析数据质量问题的第一步。它有助于识别问题,但

无法确定问题的根本原因,也无法确定问题对业务流程的影响。确定影

响需要数据链上的利益相关方的介入。在规划大规模分析时,确保分配

足够的时间来共享结果、确定问题的优先级,并确定需要深入分析的问

题。

13.2.6 定义数据质量改进目标

初步评估获得的知识为特定的数据质量提升目标奠定了基础。数据

质量提升可以采取不同的形式,从简单的补救(如纠正记录中的错误)

到根本原因的改进。补救和改进计划应考虑可以快速实现的问题(可以

立即以低成本解决问题)和长期的战略性变化。这些计划的战略重点应

是解决问题的根本原因,并建立问题预防机制。请注意,许多事情都会阻碍改进工作:系统限制、数据龄期、正在

进行的使用有问题数据的项目、数据环境的总体复杂性、文化变革阻

力。为了防止这些限制阻碍质量改进工作的进行,须根据对数据质量改

进带来业务价值的一致性量化,设定具体的、可实现的目标。

例如,根据流程改进和系统编辑,目标可能是将客户数据的完整性

从90%提高到95%。显然,比较初始度量的结果和改进后的结果才能显

示改造的成效。但价值来自改进的好处:减少客户投诉、减少纠正错误

的时间等,通过测量这些东西来解释改进工作的价值。改善数据必须有

积极的投资回报,没有人关心字段完整性的级别,除非有业务影响。当

发现问题时,根据以下内容确定改进的投资回报率:

1)受影响数据的关键性(重要性排序)。

2)受影响的数据量。

3)数据的龄期。

4)受问题影响的业务流程数量和类型。

5)受问题影响的消费者、客户、供应商或员工数量。

6)与问题相关的风险。

7)纠正根本原因的成本。

8)潜在的工作成本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

手把手教你学AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值