8、基于集群模型的异步全分布式随机梯度下降算法

最新推荐文章于 2025-10-30 20:09:04 发布

blue

最新推荐文章于 2025-10-30 20:09:04 发布

阅读量12

点赞数

CC 4.0 BY-SA版权

分类专栏：算法与复杂性前沿探析文章标签：分布式随机梯度下降异步全分布式强凸函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/blue/article/details/152649755

算法与复杂性前沿探析专栏收录该内容

51 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于集群模型的异步全分布式随机梯度下降算法

在分布式随机梯度下降（SGD）算法领域，有许多相关的研究工作。本文将介绍一种基于集群模型的异步全分布式SGD算法，该算法在处理强凸和非凸代价函数时都有良好的表现。

1. 相关工作

在分布式SGD算法的大量文献中，弹性一致性框架假设进程计算随机梯度所用参数与实际全局参数的差异是有界的。在这个假设下，SGD对于凸和非凸目标函数都能收敛。例如在共享内存和消息传递场景中，都有符合这一假设的情况，但它们都假设了有界异步性，即梯度陈旧性有最大延迟。

本文的算法是完全异步的，不假设不同进程在执行过程中所处迭代的差异有任何界限，并且会忽略早期轮次的陈旧消息。一些类似的SGD算法主要处理恶意故障，且未将收敛速率与进程数量建立函数关系，也未针对崩溃故障进行优化。还有一些去中心化算法假设通信由图决定，而本文考虑的是全连通通信图的系统，所有进程都可以相互发送消息。

2. 预备知识

2.1 计算模型

系统中有 $n$ 个进程，被划分为 $m\leq n$ 个不相交的集群 $P_1, …, P_m$。每个进程可能会崩溃并停止执行步骤，不崩溃的进程为非故障进程。每个集群有一个共享内存，只有该集群内的进程可以进行读写操作。进程之间通过异步可靠通信链路发送消息，非故障进程之间的消息最终会送达，但送达时间无上限。

设 $f$ 为最多可崩溃的进程数，$f^ $ 是一个最大整数，使得任何大小为 $n - f^ $ 的进程集合 $P$ 能代表多数进程。若 $f\leq f^*$，则任意两个代表 $n - f$ 个进程的集合 $P$ 和 $Q$ 必定包含来自同一个集群的进

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。