从数据到云端:构建云架构的数据基础
1. 理解数据
在云计算的实施过程中,理解数据是至关重要的第一步。这不仅需要明确数据的存在位置,收集数据的相关信息(如模式和元数据),还需运用业务原则来确定数据的流向和原因。
1.1 数据理解的重要性
理解数据是整个过程中最繁琐的部分。它要求我们深入研究信息的具体细节,并创建诸如数据字典之类的传统交付物,以定义元数据。以下是数据理解过程中的关键步骤:
- 创建问题域内系统的列表,以此确定支持这些系统的数据库。
- 明确数据库的所有者、物理位置、相关设计信息,以及数据库技术的品牌、型号和版本等基本信息。
- 利用能够逆向工程现有物理和逻辑数据库模式的技术,辅助识别问题域内的数据。
1.2 数据识别的挑战
在企业内部识别数据并非易事,因为数据相关信息(包括业务和技术信息)通常分散在各个角落,质量也参差不齐。对于部分封装信息系统(如 ERP 或 CRM 系统)中的数据,可能需要依赖软件供应商提供相关信息和访问权限。
1.3 数据字典的创建
为了存储和管理分析数据时的元数据及其他信息,需要为每个系统创建数据字典。由于不同系统的特性差异较大,数据字典通常按系统分别创建。以下是数据字典中通常记录的信息:
- 特定数据元素存在的原因
- 所有权
- 格式
- 安全参数
- 在逻辑和物理数据结构中的角色
可以使用存储库等工具创建和维护数据字典,部分数据库的 DBMS 也内置了数据字典功能。在创建过程中,无需过于关注维护方式,关键是准确列出相关信息。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



