数据仓库模型的维护与管理
1. 数据仓库业务决策与模型设计考量
在数据处理方面,存在一个业务决策问题。企业一方面可能决定仅对未来的数据进行分析,这种情况下无需担忧其他。另一方面,企业可能决定追溯性地为过去某段时间分配买家。从技术角度讲,这并不困难,只需依据产品和时间等业务规则,更新销售数据中新添加的买家外键即可。不过,这一操作的成功与否取决于采购领域历史数据的质量以及业务规则的完整性。在此之前,需要进行一些分析,判断这样做是否值得。关键问题不在于更新数据所需的工作量,而在于结果对企业是否有用,以及不准确的数据是否会产生误导信息,对数据仓库造成损害。
在数据仓库设计中,若预计会发生某些变化,需谨慎设计以提供相应的改变途径。同时,也要避免过度设计解决方案,以免增加不必要的复杂性、延长开发时间或解决可能永远不会出现的问题。若当前不存在集成问题,但未来可能出现,建议在主题领域为最重要的实体使用代理键,这样数据库就能在需要时接纳新结构和业务键,以适应集成需求。
2. 数据仓库模型的类型及变化因素
数据仓库中有四种主要的模型类型,它们各自有不同的特点和变化原因:
| 模型类型 | 描述 | 变化原因 |
| — | — | — |
| 主题区域模型 | 描绘企业感兴趣的人员、地点、事物、事件和概念等主要分组,为后续模型提供蓝图。每个业务数据模型中的实体仅分配到主题区域模型中的一个主题区域,且各主题区域定义相互排斥。 | - 缺乏完整性:数据仓库迭代构建,主题区域模型可能仅部分开发,后续需添加新主题。
- 重大业务变更:如公司进入新业务领域,可能需新增主题区域。
- 业务数据模型的细化:业务数据模型添加新实体,若无法清晰归入现有主题
超级会员免费看
订阅专栏 解锁全文


被折叠的 条评论
为什么被折叠?



