建模中冗余和范式的权衡

冗余与范式:数据模型设计的权衡
本文探讨了数据模型设计中冗余和范式的特点及权衡,指出冗余以存储换取性能,而范式则以性能换取存储。在互联网行业,根据Kimball模式实施数据仓库时,冗余和范式的应用需符合任务需求。以早上8点前处理完成的指标数据为例,为减少计算耗时,模型设计时需考虑减少多表关联,增加数据冗余。

本文是个人的一些经验和思考,欢迎留言讨论。
先说一下冗余和范式的特点:
冗余是以存储换取性能,
范式是以性能换取存储。
因此,一般在实际工作中冗余更受欢迎一些。
模型设计时,这两方面的具体的权衡,首先要以企业提供的计算能力和存储资源为基础。
其次,一般互联网行业中都根据Kimball模式实施数据仓库,建模也是以任务驱动的,因此冗余和范式的权衡符合任务需要。
例如,一份指标数据,必须在早上8点之前处理完成,但计算的时间窗口又很小,要尽可能减少指标的计算耗时,这时在计算过程中要尽可能减少多表关联,模型设计时需要做更多的冗余。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值