HIVE动态分区

最新推荐文章于 2025-11-02 17:25:36 发布

原创最新推荐文章于 2025-11-02 17:25:36 发布 · 1.2k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

使用分区是为了提高，对数据的查询，分析效率。

一，动态分区

hive有动态分区和静态分区，选用什么分区要根据是数据来决定。

比如：你有一份业务数据而且每天都有很多增量，那么怎么保证长时间积累下来的大量数据，对此就要用分区来提高查询。

这是你的数据中有时间字段，那么你就可以按时间分区，此时开启动态分区载入数据，hive会帮你按照设置好的分区自动划分数据，而不需要你再像静态分区一样手动的指定数据存入哪一分区。

开启动态分区：

1.设置参数（有3种设置hive参数的方式，这里使用set方式设置）

修改为： set hive.exec.dynamic.partitoin=true；

默认:false

此参数是开启hive的动态分区支持

修改为： set hive.exec.dynamic,partition.mode=nostrict;

默认:strict (默认是严格模式——即至少要有一个分区列为静态分区)

此参数是关闭hive的严格模式

现在就可以使用动态分区了。

另外的相关参数：

set hive exec.max.dynamic.partition.pernode;

>在一个执行节点上，允许创建的动态分区的最大量（默认100）

set hive.exec.max.dynamic.partition;

>在所有执行节点上，允许创建的动态分区的最大量（默认10000）

set hive.exec.max.created.files;

>所有mr job允许创建的文件的最大数量（默认100000）

以上参数根据实际请款调节

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。