【论文代码复现】Clustered Sampling: Low-Variance and Improved Representativity for Clients Selection in Fede_admin11111111的博客-优快云博客https://blog.youkuaiyun.com/admin11111111/article/details/120499243上一篇文章最后留了一个疑惑,经过检验确实是有问题的,那样写逻辑是错误的。并不符合论文中将所有clients都采样的说法。然后在更改了epsilon之后就可以正常运行了,但是给出的代码中直接是默认所有clients的样本量都相同,所以分配的权重也都相同。
算法1实现:
具体实现就是将100个clients按照权重大小从大到小排序再分成k=10组,然后计算根据权重大小计算每组中client的抽样概率。因为算法1中给的client的样本数量都相同,所以权重相同,各个clients抽样概率也相同。
于是这就有漏洞了——如果有恶意攻击者命名数据量很小,却说自己