分布式学习

nihaoHi401

于 2024-09-24 12:13:59 发布

阅读量518

点赞数 25

文章标签：分布式学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_72189290/article/details/141382805

版权

一.分布式系统基础理论

分布式系统基础理论涵盖了设计、实现和操作分布式计算系统的一系列概念和原则。这些理论帮助理解如何在多个独立的计算机系统之间协调工作，从而实现更高的可扩展性、容错性和性能。以下是一些核心的分布式系统基础理论：

1. CAP 定理

Consistency (一致性): 所有节点在同一时间看到相同的数据。
Availability (可用性): 每个请求都能接收到非错误的响应，但不保证数据的一致性。
Partition Tolerance (分区容忍性): 系统在遇到任意数量的网络分区故障时仍能继续操作。
结论: 在一个分布式系统中，最多只能同时满足 CAP 三者中的两个。在分区发生时，系统必须在一致性和可用性之间做出权衡。

2. 分布式一致性模型

强一致性: 每次操作的结果对所有后续操作立即可见（如传统数据库的 ACID 特性）。
最终一致性: 系统在没有新的更新时，最终会收敛到一致状态，允许临时的不一致（如许多 NoSQL 数据库的模型）。
因果一致性: 保证因果相关的操作顺序的一致性，而不要求严格的全局一致性。

3. 分布式共识算法

Paxos: 一种用于分布式系统中一致性问题的共识算法，广泛用于需要强一致性的分布式系统中。
Raft: 类似于 Paxos，但更易于理解和实现，通常用于分布式日志系统。
ZAB (Zookeeper Atomic Broadcast): Zookeeper 使用的共识算法，支持高效的主备切换和状态一致性。

4. 拜占庭将军问题

描述了一组将军如何就是否攻城达成一致的难题，即使其中某些将军可能是叛徒。
拜占庭容错 (BFT) 算法用于解决这种场景中的一致性问题，如 Practical Byzantine Fault Tolerance (PBFT)。

5. 分布式锁

分布式环境中用于控制对共享资源的互斥访问，以防止并发访问带来的数据一致性问题。
实现分布式锁的一些机制包括基于 Redis 的锁、Zookeeper 锁，以及更复杂的算法如 Chubby。

6. 分布式事务

两阶段提交协议 (2PC): 由协调者控制的两阶段协议，用于确保分布式系统中所有参与者都同意提交或回滚事务。
三阶段提交协议 (3PC): 对 2PC 的扩展，试图在网络分区和超时的情况下避免僵局。

7. 数据复制与一致性

主从复制: 数据从一个主节点复制到多个从节点，通常用于读扩展和容错。
多主复制: 允许多个主节点同时处理写操作，适用于高可用性和地理分布的系统。
Quorum (法定人数): 在分布式系统中，操作的成功必须获得一组节点中的多数（Quorum）的同意，从而在一定程度上实现一致性。

8. 容错与冗余

冗余: 数据或服务的多副本，用于在某些节点失效时保持系统的可用性。
副本放置策略: 确定在分布式系统中如何在不同的节点上存储数据副本，以优化性能、容错和数据可用性。

9. 时间和顺序

逻辑时钟: 使用事件顺序而非实际时间戳来标记和排序事件（如 Lamport 时间戳）。
矢量时钟: 扩展逻辑时钟，用于处理并发和因果关系的复杂性。

10. Gossip 协议

一种传播信息的协议，节点间通过随机通信来逐渐传播消息，最终在整个系统中传播。

11. 分布式文件系统与存储

HDFS: 一种设计用于处理大规模数据的分布式文件系统，广泛应用于大数据领域。
对象存储: 如 Amazon S3，提供高度可扩展的存储解决方案，数据通过唯一的标识符访问。

12. 分布式计算模型

MapReduce: 一种处理大规模数据集的编程模型，通过将任务划分为 Map 和 Reduce 步骤来实现并行处理。
Actor Model: 一种并发计算模型，其中“actor”作为计算的基本单元，处理消息传递和状态管理。

这些理论共同构成了分布式系统的基础，指导开发人员设计出能够在大规模、异步环境中可靠运行的系统。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。