数据仓库模型开发全解析
1. 数据仓库原型与数据元素选择
1.1 原型开发要点
在数据仓库设计过程中,原型开发是一个关键环节。它需要数据仓库设计师与用户之间持续互动,并根据反馈对设计进行适当修订。同时,一个管理良好的原型还需明确何时停止开发,因为原型的目标是细化需求,而非提供早期的生产交付物。
1.2 源数据信息利用
源数据信息对于选择数据元素至关重要。源系统的数据结构能揭示数据在日常运营系统中的物理存储方式,为数据元素的选择提供了一份清单。若用户未请求与感兴趣的数据元素一同存储的其他元素,数据分析师应进一步询问,以确保这些额外元素确实不需要。确定所需元素后,即可进行实际纳入元素的选择。
1.3 数据元素选择过程
数据元素的选择并非易事。以一个业务问题为例:“对于特定经销商,按每个销售区域、销售领地和销售地区,针对每个州和每个大都市统计区(MSA),每种品牌、型号、系列和颜色(MMSC)的每月销售数量和销售金额趋势如何?”该问题要求的“销售趋势”意味着需要销售交易的月度汇总信息。通常,销售交易可能包含 50 - 100 个数据元素,如果用户仅需要销售数量和销售金额,数据仓库中可能会存在大量多余数据。
运营系统中的数据元素大致可分为三类:
|类别|具体元素示例|说明|
| ---- | ---- | ---- |
|肯定需要的元素|日期、销售数量、销售金额|这些元素是满足业务问题所必需的|
|肯定不需要的元素|记录更新日期和时间|对当前业务问题无直接作用|
|可能需要的元素|销售时间、特别折扣、促销津贴、销售税金额|这类元素需要重点关注,需判
超级会员免费看
订阅专栏 解锁全文
1235

被折叠的 条评论
为什么被折叠?



