#Hive常见故障 #大数据 #生产环境真实案例 #Hive #离线数据库 #整理 #经验总结
说明:此篇总结hive常见故障案例处理方案 结合自身经历 总结不易 +关注 +收藏 欢迎留言
更多Hive案例汇总方案 解决方案:请往下翻
Hive对同一张表或分区并发写数据导致任务失败
问题
Hive执行插入语句时,报错HDFS上文件或目录已存在或被清除,具体报错如下:
原因
-
根据HiveServer的审计日志,确认该任务的开始时间和结束时间。
-
在上述时间区间内,查找是否有对同一张表或分区进行插入数据的操作。
-
Hive不支持多同一张表或分区进行并发数据插入,这样会导致多个任务操作同一个数据临时目录,一个任务将另一个任务的数据移走,导致任务失败。
解决方法
修改业务逻辑,单线程插入数据到同一张表或分区。
更多Hive案例汇总方案 (点击跳转) :