MySQL半同步Semi-sync原理介绍

本文探讨了Semi-sync在MySQL中的优缺点,详细解释了其在网络延迟下的数据安全性和性能表现。Semi-sync虽增加事务延迟,但在小事务和良好网络条件下,能实现几乎零数据丢失,同时不影响性能。在主备机Crash情况下,Semi-sync通过特定机制确保数据一致性,即使在主库Crash后,也能通过备库Failover恢复未完成事务。

如果还不了解Semi-sync可以阅读(Manual | 概述

1. 优点

当事务返回客户端成功后,则日志一定在至少两台主机上存在。

MySQL在加载并开启Semi-sync插件后,每一个事务需等待备库接收日志后才返回给客户端。如果做的是小事务,两台主机的延迟又较小,则Semi-sync可以实现在性能很小损失的情况下的零数据丢失。

2. 缺点

完成单条事务增加了额外的等待延迟,延迟的大小取决于网络的好坏。

Semi-sync不是分布式事务,主库会在自己完成事务后,等待备库接收事务日志

3. 主机Crash时的处理

 

备库Crash时,主库会在某次等待超时后,关闭Semi-sync的特性,降级为普通的异步复制,这种情况比较简单。

主库Crash后,那么可能存在一些事务已经在主库Commit,但是还没有传给任何备库,我们姑且称这类事务为"墙头事务"。"墙头事务"都是没有返回给客户端的,所以发起事务的客户端并不知道这个事务是否已经完成。

这时,如果客户端不做切换,只是等Crash的主库恢复后,继续在主库进行操作,客户端会发现前面的"墙头事务"都已经完成,可以继续进行后续的业务处理;另一种情况,如果客户端Failover到备库上,客户端会发现前面的“墙头事务”都没有成功,则需要重新做这些事务,然后继续进行后续的业务处理。

4. 其他

可以做多个备库,任何一个备库接收完成日志后,主库就可以返回给客户端了。

网络传输在并发线程较多时,一次可能传输很多日志,事务的平均延迟会降低。

"墙头事务"在墙头上的时候,是可以被读取的,但是这些事务在上面Failover的场景下,是被认为没有完成的。

 

semi-synchronous并不是100%的保证数据不会丢失,如果master在完成事务并将其发送给slave的时候崩溃,仍然可能造成数据丢失。只是相比于传统的异步复制,semi-synchronous replication能极大地提升数据安全。更为重要的是,它并不慢,MHA的作者都说他们在facebook的生产环境中使用了semi-synchronous(这里),所以我觉得真心没必要担心它的性能问题,除非你的业务量级已经完全超越了facebook或者google。

 

另外,如果是一主多备的话,可以认为备库永远不会挂掉(可以做多个备库,任何一个备库接收完成日志后,主库就可以返回给客户端了)。如果主库挂掉的话,自动或者人工切换到其中任何一个备库,这样客户端会重新操作上面失败的数据(主库可能有了,可也也可能没有上个事物的数据),因为对于客户端来说,无论crash的主库是否成功,客户端都会失败,客户端都会对备库重新操作上客户端认为失败的那个事物。基本可以保证了数据的不丢失问题。

 

转载于:https://www.cnblogs.com/rayan/p/10860774.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值