分布式系统中的时钟、停顿与真相
分布式系统中的编号生成与时钟同步问题
在分布式系统中,分布式序列号生成器(如 Twitter 的 Snowflake)能以可扩展的方式生成大致单调递增的唯一 ID,例如通过将 ID 空间的块分配给不同节点。然而,它们通常无法保证与因果关系一致的顺序,因为分配 ID 块的时间尺度比数据库读写的时间尺度长。
那能否使用同步时钟的时间戳作为事务 ID 呢?如果同步效果足够好,它们会具备合适的特性,即后续事务的时间戳更高。但问题在于时钟准确性的不确定性。
Spanner 以一种独特的方式在数据中心之间实现了快照隔离。它使用 TrueTime API 报告的时钟置信区间,基于这样的观察:若有两个置信区间,分别由最早和最晚可能的时间戳组成(如 A = [Aearliest, Alatest] 和 B = [Bearliest, Blatest]),且这两个区间不重叠(即 Aearliest < Alatest < Bearliest < Blatest),那么可以确定 B 发生在 A 之后。只有当区间重叠时,我们才不确定 A 和 B 的发生顺序。
为确保事务时间戳反映因果关系,Spanner 在提交读写事务前会故意等待置信区间的时长。这样能保证任何可能读取该数据的事务都在足够晚的时间,使它们的置信区间不重叠。为尽量缩短等待时间,Spanner 需要尽可能减小时钟不确定性,为此 Google 在每个数据中心部署了 GPS 接收器或原子钟,使时钟同步误差控制在约 7 毫秒内。
使用时钟同步来实现分布式事务语义仍是一个活跃的研究领域,但除 Google 外,这些想法尚未在主流数据库中得到广泛应用。
超级会员免费看
订阅专栏 解锁全文
755

被折叠的 条评论
为什么被折叠?



