问题如下,在使用presto查询hive表中数据时,报了“Error opening Hive split hdfs”,详细的日志,意思是Hive在处理数据的时候使用的是ORC文件有问题,但是看了读取的文件,明显是snappy格式的文件,所以读取的文件是畸形的ORC文件。
现在很简单,查看我们的Hive建表语句。show create table xxx表。
查看了一下Hive的建表语句,发现Hive是一张外部表

文件是ORC格式,读取时候时候使用的是OrcInputFormat

问题清楚了,现在删除我们的外部表,重新创建hive外部表,格式和文件格式保持统一即可。使用parquet文件格式。

本文解决了一个在使用Presto查询Hive表时遇到的“Error opening Hive split hdfs”错误。问题源于读取的ORC文件格式不正确,通过检查并调整Hive表的文件格式为Parquet,成功解决了该问题。
654

被折叠的 条评论
为什么被折叠?



