数据表分区解决方案

本文探讨了数据仓库中大表处理的性能问题,提出了通过数据表分区来优化查询速度的解决方案。具体包括按日期和ID进行分区的策略,详细介绍了创建分区函数和分区方案的SQL代码,并展示了在实际操作中,对插入和更新操作性能提升约10%的效果。

数据表分区解决方案

问题归纳:

数据仓库根据不同的业务情况数据的量也是不同的。对于数据仓库来说,处理的时候是需要对相应的表进行查询的,因此对查询的优化也就是对整个处理过程的优化。我们一般对那些数据量比较大的度量值表进行按年建表,或者按月建表的方式来优化其查询的速度。但是有时候某些维度表的数据也会非常的多(数据仓库中维度表不能使用分区),或者是已经按月建表的但是每个月的数据量仍然非常大,严重的影响了数据仓库的处理性能。

方案提出:

对那些数据量非常大的表进行分区处理,根据不同的情况按照日期或者ID进行拆分

处理方式:

在新建数据库的时候,建多个文件组,用来存储不同分区函数来分隔的数据,每个文件组分别建多个数据文件,减少I/O的读写。建议每个数据文件不要大于3G。以后可以动态添加数据文件

1、那些按年建的表,按照季度分成4个分区,1

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值