在这一部分,我们讲Raft几个子问题中的日志复制问题。主要内容是讲Raft为什么要进行日志复制,以及如何进行日志复制的。日志复制(log replication)是leader的主要工作之一。在前面的第一、二部分,我们讲到了日志(log)是Raft的一致性保证非常重要的组成部分,很大程度Raft是利用log做的数据一致性。那么我们就来说说日志。
日志是啥
上图是Raft论文中的图片,我们可以之间看。每台服务器上都有自己的本地log,图中一行是一个服务器。对于一台服务器上的log,可以理解为一个list。list里面有两个元素,一个是term,一个是操作。结构大概是这样:
{
term1:operation1,
term2:operation2
……
}
当然,list也有索引(log index),如图最上面的1,2,3,4……。那么日志就长这样,保存着每个任期的每个操作。一个“term1:operation1”组合,被叫做一个entry。当leader认为log里面保存的entry操作可以被执行时,那么就会执行log里面的操作了。
假如说,每台服务器上的log内容都是一样的,那么执行log操作(也叫提交(commit))的时后,服务器里面的状态机(state machin,见Raft协议详解一)的内容也一定是一样的,因为状态机的内容就是log执行的结果。换句话说,我只要保证了每台服务器上的log内容一致,那么也就保证了数据(状态机内容)的一致了。
那么,如何保证日志一致呢?