BrainTorrent: A Peer-to-Peer Environment for Decentralized Federated Learning

最新推荐文章于 2022-06-29 09:31:29 发布

クズの本懐

最新推荐文章于 2022-06-29 09:31:29 发布

阅读量1k

点赞数 1

分类专栏：联邦学习文章标签：算法深度学习机器学习神经网络数据挖掘

本文链接：https://blog.youkuaiyun.com/qq_44026293/article/details/114698691

版权

联邦学习专栏收录该内容

14 篇文章

订阅专栏

背景

最近想要找一些去中心化联邦的论文看，然后找到了一篇Peer-to-Peer的文章。这些文章所用于去中心化的方法一般都是从网络协议入手，与上一篇分享的用gossip协议来完成去中心化的出发点一样。于是今天想分享一下这篇Peer-to-Peer的论文顺便对目前的去中心化的工作做一个小的总结

传统FL VS P2PFL

在这里插入图片描述
上图描述的是传统FL和P2PFL的比较。
传统FL在每一个round的训练方式是：

每一个client在本地用本地数据集训练出一个本地模型
每个client将训练好的本地模型发送到Server中
Server聚合收到的所有模型
Server将聚合得到的模型发回给每个client

P2PFL在每一个round的训练方式是：

$C_1$ 向其他的四个client发送ping请求
$C_2$ 和 $C_3$ 有更新版本的模型， $C_4$ 和 $C_5$ 没有更新版本的模型，因此 $C_2$ 和 $C_3$ 将他们的模型发送给 $C_1$
$C_1$ 将 $C_2$ 和 $C_3$ 发送给它的两个模型和自身的模型进行聚合
$C_1$ 用自身的数据集对聚合之后的模型进行微调

算法

每个client上都维护着一个vector $\in \mathbb{N}^N$ ，包含了该client上的模型的版本还有最新用于聚合的其他 $N - 1$ 个client上模型的版本

在这里插入图片描述

算法步骤如下：

在训练的开始每个client先用本地的数据集训练本地模型几个轮次
然后在每个round，执行以下步骤：
- 随机选择一个client $C_i$
- $C_i$ 向剩下的 $N - 1$ 个client发送ping请求
- 对于每个 $C_j$ （其中 $j\in \{1,...,i-1,i+1,...,N\}$ ），如果它的模型版本大于 $C_i$ 最近一次聚合所使用的 $C_j$ 的版本，那么 $C_j$ 将新的模型 $W^j$ 和数据集大小 $a_j$ 发送给 $C_i$
- $C_i$ 使用公式 $W\leftarrow W + \frac{a_j}{a}W^j$ 聚合模型
- $C_i$ 使用本地数据集对聚合得到的模型进行微调
- $C_i$ 更新本地的版本数据 $v^i$
重复步骤（2）直至模型收敛

总结-网络协议实现去中心化

上周和这周分享的论文都是关于如何实现去中心化联邦，方法都是使用已有的网路协议来对传统的联邦聚合方法进行改进，达到去中心化的效果。使用gossip协议的优点在于，可以通过segmentation来达到降低单条通信链路上的开销，不足之处在于所有训练节点达成共识（每个节点上的模型一样）的过程过慢，并且整体通信开销要大；P2P的优点在于比起gossp协议，可以让所有训练节点达成公式，但是通信开销依旧是一个瓶颈。接下来打算继续看看有没有其他相关的网络协议可以有更好的效果。