在使用hive建表加载数据时,如果是一个分区,那么用alter table mytable ADD IF NOT EXISTS PARTITION(p1='p1') location 'hdfs://xxx' 或者直接用msck repair table mytable都可以将指定目录的数据加载到分区
但是对于多级目录来说,比如
- /data/year=/month=/day=/source1/abc.log
- /data/year=/month=/day=/source2/def.log
/partition_name=partition_value/
且不能包含特殊字符
当多级目录时,这时候会有/特殊字符,那么可设置hive.msck.path.validation为skip或者ignore 就可以了
set hive.msck.path.validation = ignore