环境:hive-1.1.0-cdh5.13.0
重跑 insert overwrite table tablename partition(dt=’${dt}’) …新加的字段为null的问题:
-
执行修改表语句:
alter table table_name add columns(newCol string comment ‘新加的字段’);
-
重新insert overwrite 历史已存在的分区后发现 newCol字段为null,新分区正常,无论是内部表还是外部表均有该问题。
-
在新增字段之后及时对表进行msck repair table 仍然存在问题
原因:
使用alter table语句更新结构时,由于默认更新现有表结构,对原有分区无改动,导致原有分区改变数据时,新字段为null
解决办法:
删除旧分区,因为虽然HDFS上的数据更新了,但是我们查询的时候仍然查询的是旧的元数据信息(即Mysql中的信息)
-
在插入完数据后,需要删除元数据的旧分区
alter table table_name drop partition (dt=‘dt’); -
修复分区的两种方式:
添加该分区
alter table table_name add partition(dt=‘dt’);
通过修复分区也可以
msck repair table table_name;
再次查询数据,发现插入的数据成功了