作者:任坤
现居珠海,先后担任专职 Oracle 和 MySQL DBA,现在主要负责 MySQL、mongoDB 和 Redis 维护工作。
本文来源:原创投稿
*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。
1、背景
线上有套10节点clickhouse集群,5分片 * 2副本,版本19.7.3。
开发执行一个创建分布式表的操作,9个节点都成功返回,有个节点报错,返回信息如下:
Code: 159. DB::Exception: Received from 127.0.0.1:9000. DB::Exception: Wa
tching task /clickhouse/task_queue/ddl/query‐0003271440 is executing longer
than distributed_ddl_task_timeout (=180) seconds. There are 1 unfinished ho
sts (0 of them are currently active), they are going to execute the query i
n background.
2、诊断
登录该节点查看show processlist,正在执行1个分布式ddl,该ddl已经运行100多个小时,应该是卡住了。

clickhouse的分布式ddl是串行执行的,每次将任务存储到zookeeper
的/clickhouse/task_queue/ddl目录,按照FIFO排列。
对于每个节
clickhouse分布式DDL卡死:优化表引发的长时阻塞策略

文章讲述了在ClickHouse 19.7.3集群中,遇到分布式DDL任务超时的问题,通过诊断发现是优化表操作卡住,影响后续任务。解决方法包括重命名表、手动执行本地DDL和降级数据同步策略。建议升级到20.x版本以避免类似问题。
最低0.47元/天 解锁文章
3057

被折叠的 条评论
为什么被折叠?



