hive中union all 报错Dag submit failed due to 1-1 Edge. Destination vertex parallelism must match source

最新推荐文章于 2024-07-30 09:01:39 发布

原创

最新推荐文章于 2024-07-30 09:01:39 发布 · 1k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#hive #hadoop #数据仓库

在 Apache Hive 中使用 UNION ALL 时遇到 “Dag submit failed due to 1-1 Edge. Destination vertex parallelism must match source vertex” 这样的错误通常与底层执行引擎（如 Tez 或 MapReduce）的并行度配置有关。这个错误表明在作业的某个阶段，源顶点和目标顶点的并行度（即并行任务的数量）不匹配。

解决步骤

检查 Hive 配置：
- 确保 Hive 配置（如 hive-site.xml）中的相关参数设置正确。特别是与 Tez 或 MapReduce 相关的配置，如并行度（mapreduce.job.reduces 或 Tez 相关的配置）。
调整并行度：
- 如果你在使用 MapReduce，可以尝试调整 mapreduce.job.reduces 的值。这个值决定了 reducer 的数量，可能会影响作业的并行度。
- 如果你在使用 Tez，检查 Tez 的配置，特别是与并行度相关的配置，如 tez.am.resource.memory.mb、tez.am.resource.cpu.vcores、tez.session.am.dag.submit.timeout.secs 等。
优化查询：
- 检查你的 UNION ALL 查询是否可以被优化。例如，如果可能的话，尝试减少参与 UNION ALL 的表或查询的数量，或者检查是否有表可以被更有效地过滤或索引。
- 确保每个