2020 6.824 的 Raft Lab 3B

前言

做2020的MIT6.824,完成了实验Raft Lab3B,通过了测试,对于之前的Raft实现的实验请参考Raft Lab 2ARaft Lab 2BRaft Lab 2C 以及Raft3A

Lab3B主要需要完成日志压缩的需求,以保证实用性以及性能上的需求。总的来说,这个实验需要改进的地方很多,尤其是我的代码其实之前一直上从index=0开始的,到这个实验卡壳才发现index=1,于是又修改了之前的Raft代码,也参考了网上大家的已有实现,然后才逐渐实现日志压缩的需求的。


一、Overview

1.1 流程

  1. KVServer发现log size大于设定好的阈值,通知对应的Raft server discard log,并把log的snapshot传过去
  2. Raft server收到KVServer的通知,截断snapshot之前的log,并通知persister保存KVServer传过来的snapshot
  3. leader在发送心跳的时候如果发现有新的snapshot persist了,通知followers InstallSnapshot
  4. follower 收到InstallSnapshot,与本地log进行对比,跟新log,并通知persister保存leader传过来的snapshot
  5. follower通知对应的KVserver,reset kvStore保持其一致性

二、Implementation details

2.0.0 新的properties

这个paper Figure13 其实也有讲到,但是本实验并不要求offset,所以就剩下如下的新的属性了,这些属性会在后面InstallSnapshot具体讲到,其中lastIncludedIndex以及lastIncludedTerm也被我放到了KVServer和Raft的属性中了

Arguments:

term leader’s term
lastIncludedIndex the snapshot replaces all entries up through and including this index
lastIncludedTerm term of lastIncludedIndex
data[] raw bytes of the snapshot chunk, starting at offset

Results:

term currentTerm, for leader to update itself

type KVServer struct {
   
	...
	
	lastIncludedIndex int
}

type Raft struct {
   
	...
	//snapshot
	lastIncludedIndex int
	lastIncludedTerm  int
}

2.0.1 Helper functions

由于snapshot的引入,log本身的长度就跟index不一致了,需要加上snapshot的长度,于是引入了一些helper functions

func (rf *Raft) getLog(i int) LogEntry {
   
	return rf.log[i-1-rf.lastIncludedIndex]
}

func (rf *Raft) getLogLen() int {
   
	return len(rf.log) + rf.lastIncludedIndex
}

func (rf *Raft) convertedIndex(i int) int {
   
	return i - 1 - rf.lastIncludedIndex
}

func (rf *Raft) getLastLogIndex() int {
   
	return rf.getLogLen()
}

func (rf *Raft) getLastLogTerm() int {
   
	lastLogIndex := rf.getLastLogIndex()
	if lastLogIndex <= rf.lastIncludedIndex {
   
		return -1
	} else {
   
		return rf.getLog(lastLogIndex).Term
	}
}

2.1 log size detection

KVServer发现log size大于设定好的阈值,通知对应的Raft server discard log,并把log的snapshot传过去

为流程的第一步,检测log size是否过大需要discard,如果满足条件,生成snapshot via getSnapshot(),并且通知下层Raft discard log via kv.rf.DiscardEarlyEntries(kv.lastIncludedIndex, snapshot)

func (kv *KVServer) snapshotMonitor() {
   
	for {
   
		if kv.killed() || kv.maxraftstate == -1 {
   
			return
		}
		if kv.rf.IsExceedLogSize(kv.maxraftstate) {
   
			//save state
			kv.mu.Lock()
			snapshot := kv.getSnapshot()
			kv.mu.Unlock()

			//tells Raft that it can discard old log entries
			if snapshot != nil {
   
				kv.rf.DiscardEarlyEntries(<
### 6.824 Raft 实验测试脚本下载与示例 针对6.824课程中的Raft实验,通常会使用Go语言编写测试脚本来验证实现的正确性和稳定性。这些测试脚本位于项目的`tests`目录下,并且可以通过执行特定命令来运行。 #### 获取项目源码及其测试套件 为了获得完整的测试环境,建议克隆官方GitHub仓库: ```bash git clone https://github.com/username/lab.git cd lab/src/raft ``` 这里假设`username`代表维护该实验室代码的具体账户名,在实际操作时应替换为正确的用户名或组织名称。 #### 运行基本测试案例 一旦获得了源码库,就可以利用内置工具来进行初步的功能性检测: ```bash go test -run 2A ``` 上述命令专门用于检验Leader Election部分是否正常工作[^3]。当所有指定条件满足后,终端将会显示出相应的成功消息以及耗时统计信息。 #### 调试复杂场景下的行为表现 对于更深入的问题排查或是性能瓶颈分析,则需依赖于定制化的shell辅助程序——例如提到过的`test-mr.sh`。此脚本负责在子目录`mr-tmp`内启动一系列流程;遇到异常状况时能够暂停后续动作以便审查中间产物[^1]。 此外,面对偶发性的故障现象(比如每几十次甚至上百次才重现一次的情况),应当考虑增强日志记录强度,即编辑配置文件`config.go`加入更多诊断语句帮助定位潜在缺陷所在位置[^2]。 #### 示例:调整Shell Script以适应不同需求 下面给出了一段经过简单改造后的`test-mr.sh`片段,旨在展示如何设置断点从而便于观察具体环节的状态变化: ```bash #!/bin/bash set -e # 遇到任何错误立即终止整个脚本执行 # 原始逻辑... ./your_test_program || exit $? # 如果测试失败则停止进一步的操作 echo "Test failed, inspecting intermediate files..." ls mr-p "Press enter to continue or Ctrl+C to abort..." # 提供人工干预机会 ``` 通过这种方式可以在每次出现问题之后手动决定下一步行动方向,而不会因为自动清理机制而导致有价值线索丢失。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值