目录
0.概述
DMBOK2第十二章主要讲述了元数据管理的相关内容。该章节详细阐述了元数据的作用、目的、业务驱动因素,以及元数据的相关概念、分类、来源和架构等基础知识。同时,它还深入探讨了元数据管理的活动实践,包括所需工具、方法,并总结了管理活动的实施指南,提出了元数据治理的方法和评价度量指标。
1.元数据活动
1、定义元数据战略。
①启动元数据战略计划。
②组织关键利益相关方访谈。
③评估现有的元数据资源和信息架构。
④开发未来的元数据架构。
⑤制定分阶段的实施计划
2、理解元数据需求。
①更新频次 ②同步情况 ③历史信息 ④访问权限 ⑤存储结构
⑥集成要求 ⑦运维要求 ⑧管理要求 ⑨质量要求 ⑩安全要求
3、定义元数据架构。
①创建元模型。
②应用元数据标准。
③管理元数据存储。
4、创建和维护元数据。
管理元数据质量的方法:责任、标准、改进。
①整合元数据。
②分发和传递元数据。
5、查询、报告和分析元数据。
元数据管理活动的内容对于备考时间紧张的考生来说,建议先理解其核心概念和重要性。如果备考时间宽裕,可以进一步深入,将这些内容作为解答题的知识点进行记忆。
2.元数据来源
1、应用程序中元数据存储库。
2、业务术语表。
3、商务智能工具。
4、配置管理工具。
5、数据字典。
6、数据集成工具。
7、数据库管理和系统目录。
8、数据映射管理工具。
9、数据质量工具。
10、字典和目录。
11、事件消息工具。
12、建模工具和存储库。
13、参考数据库。
14、服务注册。
15、其他元数据存储。
业务术语表,数据字典、数据库管理和系统目录,三个最重要的元数据来源。
3.元数据的架构类型
1、集中式元数据架构。
优点:
①高可用性,因为它独立于源系统。
②快速的元数据检索,因为存储库和查询功能在一起。
③解决了数据库结构问题,使其不受第三方或商业系统特有属性的影响。
④抽取元数据时可进行转换、自定义或使用其他源系统中的元数据进行补充,提高了元数据的质量。
缺点:
①必须使用复杂的流程确保元数据源头中的更改能够快速同步到存储库中。
②维护集中式存储库的成本可能很高。
③元数据的抽取可能需要自定义模块或中间件。
④验证和维护自定义代码会增加内部对IT人员和软件供应商的要求。
2、分布式元数据架构。
优点:
①元数据总是尽可能保持最新且有效,因为它是从其数据源中直接检索的。
②查询是分布式的,可能会提高响应和处理的效率。
③来自专有系统的元数据请求仅限于查询处理,而不需要详细了解专有数据结构,因此最大限度地减少了实施和维护所需的工作量。
④自动化元数据查询处理的开发可能更简单,只需很少的人工干预。
⑤减少了批处理,没有元数据复制或同步过程。
缺点:
①无法支持用户定义或手动插入的元数据项,因为没有存储库可以放置这些添加项。
②需要通过统一的、标准化的展示方式呈现来自不同系统的元数据。
③查询功能受源系统可用性的影响。
④元数据的质量完全取决于源系统。
3、混合式元数据架构。
优点:
该架构得益于从源头近乎实时地检索元数据和扩充元数据,可在需要时最有效地满足用户需求。混合方法降低 了对专有系统进行手动干预和自定义编码访问功能的工作量。基于用户的优先级和要求,元数据在使用时尽可能是最新且有效的。混合架构不会提高系统的可用性。
缺点:
源系统的可用性是一个限制,因为后端系统的分布式特性处理查询。在将结果呈现给最终用户之前,需要用额外的系统开销将这些初始结果与中央存储库中的元数据扩展连接起来。
4、双向元数据架构。
元数据的架构类型可以与数据治理运营模型进行对比理解。其中,混合式元数据架构较为接近数据治理运营模型中的联邦式结构。
4.主动型元数据管理
(1)主动型元数据平台始终保持在线和最新状态。
(2)主动型元数据平台不仅仅是收集元数据。它们通过元数据创造智能。
(3)主动型元数据平台不仅仅停留在智能层面。它们推动行动。
(4)主动型元数据平台以API为驱动,支持嵌入式协作。
个人解读如下:
(1)实时在线:能够实时捕获、更新和提供元数据信息。
(2)智能驱动:通过机器学习和人工智能技术等,自动化分析和理解元数据,提供更深入的洞察和决策支持。
(3)以行动为导向:不只是被动地存储和编目信息,更能够基于元数据分析结果,主动触发行动和流程。
(4)全文检索和智能展现:让用户更容易地查询到所需信息。
5.元数据管理工具的功能
1、元数据采集。
2、元数据查询。
3、元数据分析。
4、元数据变更管理。
5、元数据浏览视图。
6、元数据版本管理。
7、权限管理。
8、主动型元数据管理
若在CDGP考试中遇到关于元数据管理系统应具备哪些功能的问题,你可以参考以上内容作答。可以提及主动型元数据管理,并强调其重要性。
6.其他
还有几个重要知识点需要强调:
(1)元数据等同于数据资源目录,但这二者并不等同于数据资产目录。要使资源成为资产,还需要进行登记、认可、价值评估以及进入流通环节。
(2)元数据不仅应包含现有的数据类型和约束条件,还应包括数据质量和数据安全属性。
(3)企业数字化转型应该从元数据管理开始。
(4)ISO的元数据注册标准ISO/IEC 11179提供了用于定义元数据注册的框架。这个知识点在CDGA考试的选择题中可能会被考查到。
1783

被折叠的 条评论
为什么被折叠?



