
在原生分布式数据库中,数据的多个副本采用一致性协议实现同步,其中OceanBase(简称OB)采用了Paxos协议,TiDB和Cockroachdb(简称CRDB)采用了Raft协议。
有朋友说,之所以OB采用Paxos,是因为其始于2010年,那时Raft协议还没有出来,否则OB也会用Raft了。其实,到今天我们还去研究原生Raft和Paxos哪一个协议更好时已经没有什么意义了...
虽然两种协议在原生定义中实现方式有很大不同,但是分布式数据库要确保副本数据一致性和性能体验的目标是一致的,所以经过厂商一系列工程实现,两者在产品中都有比较趋同的表现效果(上一篇文章已经说过了,这里就不细说了)
Paxos和Raft协议的应用效果上还有一个很大的不同点,就是对并发事务的支持上:
1)Raft的实现流程比较简单,因此为了保证一致性,日志复制的过程是严格按照log-index顺序执行的。
即同一个Raft-group(region)内部如果有多个并发事务修改数据,那么这些数据在多个副本之间同步日志时是串行进行的,所以这样的并发事务如果很多,那么就会产生很大的性能阻碍;
所以,我们看到用Raft协议的数据库,数据都是按range(范围)进行切片的(另外也支持hash切分,其实hash也是一样的,把数据划分到不同的hash桶以后,每个桶内还是会按range再次切分)。
Range切分的原理就是对数据以主键进行排序,然后尽量切分成大小均匀的多个切片(切片的大小可以通过参数控制)。
每个切片的多个副本之间构成一个Raft-group,如此就把大量数据尽可能分割成更多细小的切片,通过增加Raft-group的数量来提高并行事务的支持能力。
通过对Raft这一特性的了解,我们在日常应用的时候,如果发现性能问题是r

最低0.47元/天 解锁文章
685

被折叠的 条评论
为什么被折叠?



