本文是个人的一些经验和思考,欢迎留言讨论。
先说一下冗余和范式的特点:
冗余是以存储换取性能,
范式是以性能换取存储。
因此,一般在实际工作中冗余更受欢迎一些。
模型设计时,这两方面的具体的权衡,首先要以企业提供的计算能力和存储资源为基础。
其次,一般互联网行业中都根据Kimball模式实施数据仓库,建模也是以任务驱动的,因此冗余和范式的权衡符合任务需要。
例如,一份指标数据,必须在早上8点之前处理完成,但计算的时间窗口又很小,要尽可能减少指标的计算耗时,这时在计算过程中要尽可能减少多表关联,模型设计时需要做更多的冗余。
建模中冗余和范式的权衡
冗余与范式:数据模型设计的权衡
最新推荐文章于 2025-11-03 14:39:15 发布
本文探讨了数据模型设计中冗余和范式的特点及权衡,指出冗余以存储换取性能,而范式则以性能换取存储。在互联网行业,根据Kimball模式实施数据仓库时,冗余和范式的应用需符合任务需求。以早上8点前处理完成的指标数据为例,为减少计算耗时,模型设计时需考虑减少多表关联,增加数据冗余。
4万+

被折叠的 条评论
为什么被折叠?



