数据仓库设计与物理实现全解析
1. 数据仓库表映射与转换
在数据仓库设计中,首先要对各维度表进行源系统映射和转换操作。以部分表为例,以下是相关信息:
| 列名 | 描述 | 来源 | 转换 |
| — | — | — | — |
| title | 歌曲/电影/书籍标题 | jim.title | 无 |
| artist | 歌手、明星或作者 | jim.artist | 无 |
| product_type | 产品层级的一级分类,如音乐、电影或书籍 | jpt.description | 无 |
| product_category | 产品层级的二级分类,如电影的惊悚、西部、喜剧等类型 | jc.name | 无 |
| media | 媒体格式,如 MP3、MPG、CD 或 DVD | jm.name | 无 |
| unit_price | 单件商品价格 | jim.unit_price | 除以当日 jcr.rate |
| unit_cost | 分配的直接和间接成本 | jim.unit_cost | 除以当日 jcr.rate |
| status | 根据与供应商的合同状态,分为即将推出、活跃、过期 | jps.description | 无 |
完成这些映射和转换后,要对客户和商店维度进行类似操作,即记录源系统表及其缩写,写出源系统表之间的连接条件,将维度列映射到源系统表和列,并确定转换方式。接着对其他事实和维度表重复此过程,最终使设计的维度数据存储(DDS)完全映射到源系统,明确每个列的来源和转换方式。
超级会员免费看
订阅专栏 解锁全文
7万+

被折叠的 条评论
为什么被折叠?



