【Clickhouse】clickhouse-copier 对百亿级数据过程中出现计划与实际同步数据量不同报错

本文档记录了使用clickhouse-copier过程中遇到的数据同步问题,由于ClickHouse对ALTER TABLE命令的数据量有限制,超过50G会报错。解决方案包括尝试手动删除表以及修改配置文件config.xml永久提升限制。最终采纳的解决方案是通过修改配置文件,增加<max_table_size_to_drop>和<max_partition_size_to_drop>为0来允许大表的删除。

同步案例

同步方法与案例就不在阐述,可以看这篇文档同步案例

同步计划

开始时间:2021年12月28日14:56:39
计划同步数据量:50869051971
带宽占用:40~50Mb/S
结束时间:2021年12月29日 07:44:06
实际同步数据量:15260647381

计划同步数据量截图

请添加图片描述
在这里插入图片描述

带宽占用截图

请添加图片描述

实际同步数据量截图

请添加图片描述

根据下图日志中反馈发现在写入piece 2的时候出现这种错误的原因在报错中已经体现出来,就是ClickHouse默认对一次ALTER TABLE命令的影响数据量大小有限制,不能超过50G,超过50G就会报错无法删除。
在这里插入图片描述

解决方案①

手动创建force_drop_table后再执行alter table。

  1. 每次alter table 50G的表后后都会删除该文件。
  2. 本次迁移一共会执行10次alter table 从第三次开始(因前两次导入到目标表后,目标表的数据量暂时未超过50G,第三次的开始的时候,发现目标的数据超过50G了)此时出现50G限制的报错,所以该方案并不适用。

解决方案②(采纳)

通过修改配置文件config.xml永久生效。

<max_table_size_to_drop>0</max_table_size_to_drop>
<max_partition_size_to_drop>0</max_partition_size_to_drop>
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大锅霍皮久

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值