静态分区与动态分区的区别:
- 静态分区是先把分区表创好,然后手动把数据导入到对应的分区里面去。
- 静态分区实在编译期间指定分区名。
- 静态分区支持load、insert两种插入方式。
- 静态分区是用于分区少,分区名可以明确的数据。
- 动态分区是有一份数据集(2015-2022年的),按照数据集的字段给动态的生成分区。
- 动态分区实在SQL执行的时候确定的。
- 动态分区前需打开:set hive.exec.dynamic.partition.mode=nonstrict;
- 动态分区只能用insert方式。
- 动态分区通过普通表选出的字段包含分区字段,分区字段放在最后,多个分区字段按照分区顺序放置。
- 比如 [订单编号,订单创建时间,订单详情编号,订单价格,订单配送员...]
- 订单创建时间(2021-11-12 12:22:49)把这个字段作为分区的字段。2021-11 这个作为分区条件。
面试题:什么时候使用静态分区,什么时候使用动态分区?