结论
先说一下问题原因,就是你在主库上操作的记录同步到从库上的时候没有找到该条记录导致。
可能有人在从库进行操作了。
背景
老任今天工作又遇到了一个奇葩问题,先说一下背景,方便大家快速理解这个报错。
背景由于历史的原因我们有个DB,存了大量的log,其实业务数据不多,数据大概有3.7T的数据,
业务数据可能就几百G,所以在我接手之后,我第一件事情进行了DB种业务数据和log数据的
拆分,之前他们在原库是每天跑ctonjob去删除log数据,但是这样子有个问题,因为这个库的
qps很高,所以会导致主从延时,甚至删除数据过多会影响到主库的性能,所以就进行了拆分。
在一切备份文件重搭从库以及对日志表进行分区分表之后,我就根据业务需要保留的log类数据时间,
根据分区清理了log数据,大概数据能缩小2T左右,效果也很明显。
然后问题这就来了。
由于主库上有cronjob删除数据,而我在自己心搭建的log数据进行了清理,所以
同步过来的删除语句就找不到记录,然后复制就中断了,所以产生如下的错误。
解决思路
#查看同步的状态
>show slave status\G;