Spark读Hive分区表报错：Caused by: org.apache.hadoop.mapred.InvalidInputException: Input path does not exist

最新推荐文章于 2024-01-30 16:23:22 发布

原创最新推荐文章于 2024-01-30 16:23:22 发布 · 2.1k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#spark #hive #input path does not exist

Spark知识大杂烩专栏收录该内容

68 篇文章

订阅专栏

本文分析了直接使用hadoop fs -rm -r命令删除Hive分区目录后，Spark读取该表时报错的原因，并提供了解决方案。通过同时执行ALTER TABLE语句删除对应的分区，可以避免Spark因找不到分区目录而引发的错误。

前言

之前删除Hive分区表的时候，直接用hadoop fs -rm -r 命令删除了hdfs上的分区目录，然后用spark读取hive的这个表的时候，就报错了：

Caused by: org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://nameservice1/data/source/ads/ads_table_test/statis_month=201908/day=11

但是用Hive读取的时候就是正常的

原因分析

删除Hive分区目录如果直接用hadoop fs -rm -r 删除那么，分区目录的确是不存在了，但是表的结构信息依然存在，用spark读取的时候会先找到表的元数据信息，一看有这个分区，然后就去加载，可到hdfs读取该目录的时候，却发现根本不存在，所以就报错。

解决方法

删除分区目录时，同时执行：

alter table test drop partition (p='xxx')

把对应的分区也删除掉就可以了。
如果已经删除了分区目录，也需要执行上以上的命令。

参考

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SunnyRivers

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

hive启动报错：Caused by: java.lang.IllegalArgumentException: java.net.UnknownHostException: ns1

hair请的的博客

10-22

5325

hive启动的时候报一下错误： Caused by: java.lang.IllegalArgumentException: java.net.UnknownHostException: ns1 看一下完整版的报错信息： Exception in thread "main" java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable

spark 写入hive报错[笔记]:Caused by: org.apache.spark.SparkException: Job aborted due to stage failure: Tas

m0_69097184的博客

12-15

1294

Spark将数据写入hive时报错：Exception in thread "main" org.apache.spark.SparkException: Job aborted.Caused by: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 2.0 failed 1 times, most recent failure: Lost task 0.0 in stage 2.0 (TID

参与评论您还未登录，请先登录后发表或查看评论

Spark Streaming实时监听HDFS目录，但出现：Input path does not exist: hdfs://node1:9000/sst-024/20180101.log._COP

a921026768的博客

06-12

1345

Spark Streaming实时监听HDFS目录，出现找不文件异常。异常主要提示信息：org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://node1:9000/sst-024/20180101.log._COPYING_ 详情如下图出现问题原因直接上传文件会在 HDFS 上生成一个临时文件，后缀是.COPYING，Spark Streaming .

org.apache.hadoop.mapred.InvalidInputException: Input path does not exist问题

duguduchong的专栏

03-24

1万+

在eclipse中跑Ｈadoop测试用例时，出现这样的错误 Exception in thread "main" org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file:/home/niy/workspace/mywordcount/input 系统无法识别HDFS文件系统，错把

Hadoop 运行Java时发生异常：org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not

分享我的点点滴滴，在成长路上与你同行！

06-01

1571

Java远程到集群上，统计单词！

Spark读取Hive分区表出现Input path does not exist的问题！！

ChengYanan的博客

10-15

1782

Hive读取正常，不会报错，Spark读取数据就会出现报错信息： org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://testcluster/user/hive/warehouse/.... 然后我们去查看一下表数据的具体在hdfs上的存储路径，去hdfs上查看，发现文件确实不存在！...

hadoop异常： org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exit

蒯厅博客

03-24

4832

出现原因：集群有要操作的目录或者文件但是本地没有吧路径写全造成的。其次是集群获取分布式文件系统没有做配置，默认是本地（你电脑下的路径）所以分布式系统找不到路径。设置如下图：以WordCount 为例最终结果如下 ...

presto本地开发，访问Hive报错：Unable to create input format org.apache.hadoop.mapred.TextInputFormat

lucyLee的博客

04-22

4468

1. 序言出于工作需要，使用mac + IntelliJ IDEA，搭建了一个可以访问Hive的本地开发环境执行查询时报错： Query 20220422_084012_00000_34axr failed: Unable to create input format org.apache.hadoop.mapred.TextInputFormat 查看日志，具体的报错信息如下： com.facebook.presto.spi.PrestoException: Unable to crea

二百二十一、Hive——HQL报错：return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

热门推荐

小夏陌的博客

12-06

2万+

报错在Spark中运行sc.textFile()等命令后报以下错误： org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://localhost:9000/Filename.txt 解决方法这是所加载文件不存在而报的错，因为配置等原因textFile()默让是在HDFS中查找文件，所以只...

org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://Master11:9000/user

Nurbiya_K的博客

09-19

1万+

在写spark 读取本地文件命令的时候报hdfs上文件不存在的错… 读取文件是分两种情况：（首先要确保文件路径写对了！！！！！） 1. 如果读取hdfs上的文件时报这个错，那么去看hdfs上是否有这个文件！！ hdfs dfs -ls / （ / 后面写要读取的文件的路径）如果没有那么就创建文件，或者把本地文件上传到hdfs上：上传本地文件： hdfs dfs -put /usr/l...

错误：org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://lo

qq_53269459的博客

02-01

1万+

org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: 异常 Input path does not exist异常分析描述：在自定义实现编译运行 WordCount 的时候，本地hadoop中已经存在已包含内容的input文件，执行 jar 操作 bin/hadoop jar workspace/WordCount.jar WordCount input1 output的时候，出现以

hive sql 遇到 input path does not exists 问题

weixin_50501247的博客

05-23

3015

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言总结前言 Hive执行过程中遇到input path does not exists 如下图图1 ：为执行HQL时的报错。图2：为执行show partitions 后查看到meta中的分区。图3：为查看Hive外表的hdfs文件存储通过 hdfs dfs -ls ‘hive location’查看。总结 Hive执行过程中遇到input path does not exists的错误是因为hive的元数据库.

spark-sh xxx.jar命令报错Input path does not exist

qq_42639540的博客

04-25

748

报错：Exception in thread "main" org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://master:9000/daas/motl/ods/od s_ddr/day_id=20180503 一：hdfs中确实没有这个文件，重新上传文件或修改路径即可二：hdf...

User class threw exception: org.apache.hadoop.mapred.InvalidInputException: Input path does not exis

我的博客

07-19

749

临时处理个小任务，结果要放到hdfs中。刚开始是设置传参：任务提交的时候在脚本中传参，但是这种一运行就报错：说路径已经存在了！！！试了几次，已进行传参就报已存在的错误。解决办法：自己直接在config.properties中给它设置死了，不进行传参，要修改在properties中修改！！！ ...

Spark读取文件Input path does not exist问题

weixin_42547302的博客

01-05

4713

Spark的sc上下文路径默认从当前部署环境中查找，在Hadoop下用sc.testFile("input")不能读到spark文件下的input 如需从本地读取，用特殊写法file:///opt/bigdata/spark/input

org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist

foradawn的博客

04-29

4085

idea下远程调试hadoop程序一直报路径不存在。。。找了好久，然后一直认为路径是正确的，然而。。。我们在hdfs系统中直接建立文件后，可能误以为这个路径就是相对路径，事实上并不是使用hdfs dfs -ls / 查看当前目录可以知道当前的相对路径是什么这个路径困扰了一下午。。。好想哭。。。无语。。。...

报错Caused by: java.lang.ClassNotFoundException: org.apache.hadoop.hive.metastore.IMetaStoreClient

04-03

这个错误通常发生在使用Hive时，可能是由于缺少Hive的相关依赖库或配置问题导致的。解决方法可能包括以下几个方面： 1. 检查Hive的安装和配置是否正确。确保Hive的相关配置文件（如hive-site.xml）中包含正确的参数值，如hive.metastore.uris等。 2. 检查是否缺少Hadoop或Hive的依赖库。可以通过检查classpath或查看错误信息中提到的缺失类的包路径来确定缺失的依赖库，并将它们添加到classpath中。 3. 检查是否使用了正确的Hive版本。如果使用的Hive版本与当前环境不兼容，也可能会导致此错误。可以尝试升级或降级Hive版本来解决问题。 4. 检查是否有权限访问Hive Metastore。如果使用了安全模式或Kerberos认证，可能需要配置相应的安全参数和授权，以确保程序可以正确访问Hive Metastore。