源数据结构的定义与导入
在数据仓库构建过程中,定义和导入源数据结构是关键的基础步骤。下面将详细介绍相关操作流程和要点。
1. 项目与元数据概述
1.1 项目与连接信息
在项目资源管理器中可以定义多个项目,但连接信息不会按项目显示在连接资源管理器中。连接适用于整个工作区,而非仅针对当前正在处理的项目。
1.2 全局对象管理
工作区中存在一些所有项目共有的对象,可通过全局资源管理器来管理这些对象,例如公共转换或公共数据规则。转换是使用 Oracle 的过程化 SQL 语言 PL/SQL 在数据库中定义的函数、过程或包;数据规则则是用于强制数据遵循特定格式的规则。
1.3 源元数据的导入与定义
元数据是描述数据的数据。我们需要告知工具源数据的样子和位置,以便在设计和运行映射来填充数据仓库时,它能构建必要的代码来检索数据。元数据在工具中以与源对象类型相对应的对象形式表示。
定义源元数据有两种方式:手动在设计中心项目资源管理器中输入定义,或者让工具自动导入数据描述。我们应尽可能选择自动导入。
需要注意的是,导入或定义源元数据与加载实际数据是不同的概念。此时我们只是导入或定义对象的定义,后续在实现目标并创建源与目标之间的映射并部署时,才会加载实际数据。
2. 创建项目
在设计中心,首先要确保定义一个项目来容纳所有工作。可以选择使用默认创建的“My Project”项目,也可以创建新的项目。这里我们选择使用默认项目,并将其重命名为“ACME_DW_PROJECT”。重命名的操作步骤如下:
- 方法一:在项目资源
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



