HIVE动态分区

 

使用分区是为了提高,对数据的查询,分析效率。

一,动态分区

hive有动态分区和静态分区,选用什么分区要根据是数据来决定。

比如: 你有一份业务数据而且每天都有很多增量,那么怎么保证长时间积累下来的大量数据,对此就要用分区来提高查询。

这是你的数据中有时间字段,那么你就可以按时间分区,此时开启动态分区载入数据,hive会帮你按照设置好的分区自动划分数据,而不需要你再像静态分区一样手动的指定数据存入哪一分区。

 

开启动态分区:

1.设置参数(有3种设置hive参数的方式,这里使用set方式设置)

修改为: set   hive.exec.dynamic.partitoin=true;

默认:false

此参数是开启hive的动态分区支持

 

修改为: set    hive.exec.dynamic,partition.mode=nostrict;

默认:strict (默认是严格模式——即至少要有一个分区列为静态分区)

此参数是关闭hive的严格模式

 

现在就可以使用动态分区了。

 

另外的相关参数:

set hive exec.max.dynamic.partition.pernode;

>在一个执行节点上,允许创建的动态分区的最大量(默认100)

set hive.exec.max.dynamic.partition;

>在所有执行节点上,允许创建的动态分区的最大量(默认10000)

set hive.exec.max.created.files;

>所有mr job允许创建的文件的最大数量(默认100000)

以上参数根据实际请款调节

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值