【FedAWS】论文笔记

实验室里哈啤酒

已于 2023-07-25 11:02:39 修改

阅读量471

点赞数 2

文章标签：论文阅读

于 2023-05-15 15:24:42 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_47754029/article/details/130679905

版权

目前这篇论文有些地方还看不太懂，我先标注出来，后续理解了再补上。

标题：Federated Learning with Only Positive Labels

来源：[2004.10342] Federated Learning with Only Positive Labels (arxiv.org)

1.5 Federated learning of a classifification model

2、FedAWS

3、结论

参考

1、前言介绍

1.1 什么是正/负样本

数据样本，对于mnist数据集而言，样本就是一张手写数字识别图片。其中样本对应的标签为：0、1、2、3、4、5、6、7、8、9这十种类别。比如我们的设备中只有1的手写数字图片，我们期望识别的结果也为1，此时的正样本即为标签为1的手写数字图片，而其他的图片全部被称为负样本.

1.2什么是embedding

embedding直译为“嵌入式”，但在机器学习中其表达是一种映射关系(本人理解）表示将高维数据通过矩阵映射为低维数据。在本文中𝑔𝜃(𝑥)：x→𝑅^𝑑将实例X映射到一个d维嵌入，而𝑊∈𝑅^𝐶×d使用这个嵌入来生成C类的评分函数f(x)。（其实就是利用矩阵乘法，W为一个C行d列的矩阵，𝑔𝜃(𝑥)为一个d行1列的矩阵，两者相乘为fx=W𝑔𝜃(𝑥)）

嵌入法embedding是一种让算法自己决定使用哪些特征的方法，即特征选择和算法训练同时进行先使用某些机器学习的算法和模型进行训练，得到各个特征的权值系数，根据权值系数从大到小选择特征。这些权值系数往往代表了特征对于模型的某种贡献或某种重要性。

1.3对于单样本学习的理解

单样本学习的案例场景：学习一个分类模型，其中每个用户只能访问单个类。例如：包括人脸识别模型或说话人识别模型的分散训练，其中除了用户特定的人脸图像和语音样本外，用户的分类器还构成了不能与其他用户共享的敏感信息。

1.4传统损失函数的缺点

如果我们使用普通的联邦学习方法，我们本质上是最小化一个损失函数，该函数只鼓励实例和嵌入空间中的正类之间的小距离。因此，这种方法将导致一个简单的最优解，其中所有实例和类都崩溃到嵌入空间中的单个点。（红字为原文翻译，这儿不太理解什么叫奔溃到单个点？看到的大神可以解释一下*-*）本人理解为损失函数会将结果刻意的往正样本训练的预期结果走。也就是给出的样本手写图片为形形色色的1，训练的结果总是1.