由于在Hive1中使用的RcFile格式存储并且没有指定Serde,当把数据文件拷贝的Hive2的目录下查询时发现数据错乱
原因:
hive1不指定Serde默认采用 org.apache.hadoop.hive.serde2.columnar.LazyBinaryColumnarSerDe
hive2不指定Serde默认采用 org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe
只需要建表时指定对序列化类即可。
本文探讨了在不同Hive版本间因默认SerDe变化导致的数据错乱问题。Hive1使用LazyBinaryColumnarSerDe,而Hive2则采用ColumnarSerDe,这可能导致数据读取时出现错误。解决方案是在建表时明确指定序列化类。
由于在Hive1中使用的RcFile格式存储并且没有指定Serde,当把数据文件拷贝的Hive2的目录下查询时发现数据错乱
原因:
hive1不指定Serde默认采用 org.apache.hadoop.hive.serde2.columnar.LazyBinaryColumnarSerDe
hive2不指定Serde默认采用 org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe
只需要建表时指定对序列化类即可。
4699

被折叠的 条评论
为什么被折叠?