- 博客(3)
- 收藏
- 关注
原创 mit6.5840-2023-Lab2C,D
1. 在Raft论文的图2中,有且仅有三个数据是需要持久化存储的。它们分别是Log、currentTerm、votedFor。Log是所有的Log条目。当某个服务器刚刚重启,在它加入到Raft集群之前,它必须要检查并确保这些数据有效的存储在它的磁盘上。服务器必须要有某种方式来发现,自己的确有一些持久化存储的状态,而不是一些无意义的数据。2. Log需要被持久化存储的原因是,这是唯一记录了应用程序状态的地方。
2025-02-16 14:48:05
856
原创 mit6.5840-2023-Lab2A,B
该算法核心成员是:领导者,跟随着以及候选者三种身份,日志条目仅从领导者流向其他服务器。Raft 使用随机定时器来选举领导者。还有一个很关键的概念,复制状态机:复制状态机被用于解决分布式系统中的多种容错问题。例如,许多依赖单一集群领导者的大型系统,通常使用一个独立的复制状态机来管理领导者选举,并存储必须在领导者崩溃后仍然可用的配置信息。复制状态机通常通过一个复制日志来实现。每个服务器都存储一个包含一系列命令的日志,其状态机会按顺序执行这些命令。
2025-02-16 14:39:12
930
原创 Mit6.5840-2023-Lab1
MapReduce 是一种编程模型和计算框架,主要用于大规模数据处理。它由 Google 提出,并在许多分布式计算系统(如 Hadoop)中得到实现。MapReduce 通过将数据处理任务分成两阶段(Map 阶段和 Reduce 阶段),使得可以在大量计算机上并行执行,从而有效地处理大数据集。
2025-02-16 14:00:37
420
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅