数据建模中的常见误区与应对策略
在数据建模过程中,存在一些常见的误区和自然的冲动,可能会影响模型的易用性和性能。本文将深入探讨这些问题,并提供相应的应对策略。
1. 抵制维度表规范化的冲动
从规范化背景出身的数据建模者,可能会有将维度表规范化的自然冲动。但我们应更关注通过易用性和性能来提供价值,而非单纯追求事务处理效率,因此要抵制一些传统的规范化冲动。
1.1 雪花模式(Snowflake Schemas)
扁平化、非规范化的维度表,其中包含重复的文本值,会让习惯于操作型世界的建模者感到不适。以产品维度表为例,300,000 个产品可归为 50 个不同的部门。规范化背景的建模者可能希望在产品维度表中存储 2 字节的部门代码,而不是 20 字节的部门描述,并创建一个新的部门维度表来进行部门解码。他们认为这样可以节省空间,因为 300,000 行的维度表只包含代码,而不是冗长的描述符。此外,他们还认为规范化的维度表更易于维护,因为如果部门描述发生变化,只需更新部门维度表中的一处,而不是在原始产品维度表中更新 6,000 次。
维度表规范化被称为雪花模式。冗余属性从扁平化、非规范化的维度表中移除,并放置在单独的规范化维度表中。然而,雪花模式存在诸多缺点:
- 增加复杂度 :大量的雪花表会使数据呈现变得更加复杂,业务用户难以理解,而简单性是维度模型的主要目标之一。
- 影响查询性能 :大多数数据库优化器难以处理雪花模式的复杂性,大量的表和连接通常会导致查询性能变慢。
- 节省磁盘空间效果不明显 :与雪花
超级会员免费看
订阅专栏 解锁全文
39

被折叠的 条评论
为什么被折叠?



