hive 锁泄露问题
问题描述: hive 表一个分区只能有一个程序/线程获得锁/写入,但发现有两个程序/线程获得了锁,最后在事务提交的时候检查到了冲突。
问题分析: hive 客户端实现在本该原子操作的 获取事务ID、启动事务 拆成了需要跨网操作的两步,导致实际串行操作的两次操作,其 [事务启动ID, 事务提交ID] 值对是交叉的(交叉则判断为冲突)。
ps. 具体可以查看hive源码 org.apache.hadoop.hive.metastore.txn.TxnHandler commitTxn方法
问题解决: 调整hive操作代码,在执行操作前从 zookeeper 获得锁、完成后释放锁,杜绝 hive 那边交叉的可能。
Hive锁冲突解析与解决方案
本文详细解析了Hive表分区锁冲突的问题,揭示了客户端实现中事务ID获取与启动事务过程的缺陷,导致了实际操作的串行化过程中出现ID值对交叉的情况。通过分析hive源码,提出了解决方案:在执行操作前从zookeeper获得锁,并在完成后释放,以避免交叉可能性。
2856

被折叠的 条评论
为什么被折叠?



