元数据 非结构化

文章讨论了元数据在信息技术领域的不同类别,包括描述、结构和管理元数据,以及它们在资源标识、组织和管理中的作用。同时,强调了数据治理的重要性,特别是对于参考数据和主数据的整合、质量规则、监控以及度量指标,如数据质量、变更活动和服务水平协议。数据治理还包括确保合规性和满足利益相关方需求的策略。

在信息技术之外的领域,如在图书馆或信息科学中,元数据被描述

为不同的类别:

1)描述元数据(Descriptive Metadata)。描述资源并支持识别和检

索,如标题、作者和主题等。

2)结构元数据(Structural Metadata)。描述资源及其组成组件之

间的关系,如页数、章节等。3)管理元数据(Administrative Metadata)。用于描述管理生命周

期的元数据,如版本号、存档日期等。

这些类别有助于了解定义元数据需求的过程。

0.5 参考数据和主数据治理

参考数据和主数据是共享资源,需要治理和管理。并非所有数据不

一致的问题都可以通过自动化处理,有的需要人们相互沟通才能解决。

如果没有治理,参考数据和主数据解决方案将仅仅是附加的一些数据整

合实用程序,无法发挥它们的全部潜能。

10.5.1 治理过程决定事项

治理过程应决定如下事项:

1)要整合的数据源。

2)要落实的数据质量规则。

3)遵守使用规则的条件。

4)要监控的行动和监控频率。

5)优先级和数据工作响应等级。

6)如何展示信息以满足利益相关方的需求。

7)参考数据管理和主数据管理部署的标准授权扎口和预期。

治理过程带来了与合规和法律相关的利益相关方及信息消费者,通

过定义把他们纳入隐私、安全和数据保留制度中,以减轻组织的风险。

作为一个不断发展的过程,数据治理在为使用参考数据和主数据的

人员制定原则、规则和指导方针时,必须有审查、接收和考虑新规则以

及对现有规则进行改变的能力。

10.5.2 度量指标

以下指标可以与参考数据和主数据质量以及支持这些努力的过程结

合起来。

1)数据质量和遵从性。数据质量仪表板可以描述参考数据和主数

据的质量。这些指标应该说明主题域实体或相关属性的置信度(百分

比),以及它在整个组织中符合实际需求的使用价值。

2)数据变更活动。审核可信数据的血缘对于提高数据共享环境中的数据质量是必要的。指标应该展示数据值的变化率,能够帮助人们深

入理解为共享环境提供数据的系统,并可被用于调整主数据管理进程中

的算法。

3)数据获取和消费。数据由上游系统供应,由下游系统和流程使

用。这些指标应该显示和追踪哪些系统在贡献数据,哪些业务区域在共

享环境中订阅数据。

4)服务水平协议(SLA)。应建立SLA并传达给贡献者和订阅

者,以确保整个数据共享环境的使用和采用。遵循SLA可以为支持流

程、技术问题和数据问题提供解释,而这些问题都有可能减缓主数据管

理应用的速度。

5)数据管理专员覆盖率。这些指标应该关注对数据内容负责的个

人或团队,并展示覆盖率的评估频率。它们可以用来识别支持方面的差

距。

6)拥有总成本。这个指标有多种影响因素、多种表达方式。从解

决方案的角度来看,成本可以包括环境基础设施、软件许可证、支持人

员、咨询费、培训等。这一指标的有效性主要是基于其在整个组织中的

持续应用。

7)数据共享量和使用情况。需要跟踪纳入主数据的数据量和使用

情况,以确定数据共享环境的有效性。这些指标应该展示数据共享环境

中流入和流出数据的定义、纳入和订阅的数量和速率

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

手把手教你学AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值