hdfs文件映射生成hive外部表时,本质是文件的序列化和反序列化
ALTER TABLE XXX
ADD IF NOT EXISTS PARTITION(event_day='{YESTERDAY}')
LOCATION 'HDFS路径';
需要注意两点:
1. hdfs文件和hive表的存储格式必须一致,如果hdfs是text格式,hive表是orc格式,数据关联不上,映射不过来
2. hdfs文件和hive表的分隔符必须一致,否则解析错误,hive的分隔符需要注意\t和\001(对应代码里的\x01)