使用Spark导数后,hive表出现类型不同查询不出问题。
通过查看Parquet的元数据,查看Parquet文件数据与Hive表是否一致。不一致时,对应字段相关处理。
查看hive数据存储发现,spark导入的数据,询问业务发现表结构发生变化。
[root@IT-CDH-Node01 ~]# hdfs dfs -ls hdfs://nameservice1/user/hive/warehouse/**.db/*t/d=20240826
Found 1 items
-rw-r–r-- 3 hive hive 45223 2024-08-26 00:01 hdfs://nameservice1/user/hive/warehouse/.db/***t/d=20240826/part-00000-f8f34cd1-b5d6-46b1-86e7-ba12e57f6ed4.c000.snappy.parquet
324

被折叠的 条评论
为什么被折叠?



