Hive动态分区太多也会有问题

最新推荐文章于 2024-07-16 10:13:23 发布

原创最新推荐文章于 2024-07-16 10:13:23 发布 · 4.4k 阅读

2 ·

CC 4.0 BY-SA版权

hive 专栏收录该内容

45 篇文章

订阅专栏

本文讨论了在使用Hive进行动态分区时遇到的异常情况，包括关闭防火墙和SELinux配置调整后的错误。文章详细分析了问题的原因可能与交换机相关，以及在集群数据量增加时对block处理不及时导致的错误。同时指出，通过缩小数据量可以成功执行SQL语句，判断动态分区数量过多可能导致问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近在测试动态分区时，猜测可能是动态分区的数太多，导致一个SQL始终报错：

aused by: org.apache.hadoop.hive.ql.metadata.HiveException: java.io.IOException: Bad connect ack with firstBadLink as 192.168.2.24:50010
at org.apache.hadoop.hive.ql.exec.FileSinkOperator.processOp(FileSinkOperator.java:602)
at org.apache.hadoop.hive.ql.exec.Operator.process(Operator.java:471)
at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java:762)
at org.apache.hadoop.hive.ql.exec.SelectOperator.processOp(SelectOperator.java:84)
at org.apache.hadoop.hive.ql.exec.Operator.process(Operator.java:471)
at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java:762)
at org.apache.hadoop.hive.ql.exec.TableScanOperator.processOp(TableScanOperator.java:83)
at org.apache.hadoop.hive.ql.exec.Operator.process(Operator.java:471)
at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java:762)
at org.apache.hadoop.hive.ql.exec.MapOperator.process(MapOperator.java:531)
... 8 more
Caused by: java.io.IOException: Bad connect ack with firstBadLink as 192.168.2.24:50010
at org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.createBlockOutputStream(DFSClient.java:3465)
at org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.nextBlockOutputStream(DFSClient.java:3381)
at org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.access$2600(DFSClient.java:2589)
at org.apache.hadoop.hdfs.DFSClient$DFSOutputStream$DataStreamer.run(DFSClient.java:2829)