开放数据质量评估模型解析
1. 数据质量评估的背景与意义
在组织中,数据质量是一个相关但未被充分内化到流程中的重要问题。虽然用户通常被认为对其管理的数据质量负责,但实际上在数据处理过程中,数据质量的保障并没有得到足够的重视。因此,开展数据质量评估相关工作具有重要意义,它能够满足组织在数据质量方面的需求。
2. 模型维度的确定
2.1 维度相关性探索
通过文献回顾和对公司专家的调查,对数据质量维度的相关性结果进行了探索。结果显示,一些维度比其他维度更为重要,如精确性、一致性、可用性、完整性和有效性等维度排在前列。
2.2 确定合适维度的步骤
为了确定适合所提出原型的维度,采取了以下步骤:
1. 根据引用该维度的文章数量,按作者重新列出维度。
2. 根据对该维度进行评估的专业人员数量,由专业人员重新列举维度。
3. 识别前面评分的平均值,从低到高进行排序,从而实现维度的优先级排序,并最终确定最多7个维度。
2.3 最终确定的重要维度
最终确定的维度包括完整性、准确性、可靠性、一致性、可用性、可访问性和完整性/有效性。不过,本项目仅考虑完整性、有效性、可用性和一致性这四个维度,并不排除其他维度,部分维度会在后续分析中考虑,并可能用于数据质量模型的原型中。
| 维度 | 描述 |
|---|---|
| 完整性 | 控制定义用于工作的属性是否包含完整数据 </ |
超级会员免费看
订阅专栏 解锁全文
4335

被折叠的 条评论
为什么被折叠?



