2023 联邦推荐系统综述

本博客结合2023年发表的综述文章,对近期一些联邦推荐文章进行总结,综述原文:

 SUN Z, XU Y, LIU Y, et al. A Survey on Federated Recommendation Systems[J]. 2023.https://doi.org/10.48550/arXiv.2301.00767

引言

        最近,已有许多工作将联邦学习应用到推荐系统中来保护用户的隐私。在联邦学习的设置中,服务器不再收集用户的个人数据,而是收集中间参数来训练模型,这极大的保护了用户的隐私。此外,联邦推荐系统可以与其他数据平台合作,以提高推荐性能,同时满足监管和隐私约束。然而,联邦推荐系统面临着隐私、安全、异构性和通信成本等诸多新挑战。虽然已经有工作在这些领域进行了大量研究,但还没有一篇综述文章。在本篇综述中,(1)总结了联邦推荐系统中使用的一些常见隐私机制,并讨论了每种机制的优点和局限性;(2)回顾了几种针对安全的新型攻击和防御策略;(3)总结了解决异构性和通信成本问题的方法;(4)为联邦推荐系统引入了一些实际应用和公共基准数据集;(5)未来提出了一些有前景的研究方向。

一、联邦推荐的一些挑战

挑战 1:用户的隐私问题

        隐私保护通常是FedRS的主要目标。在FedRS中,每个参与者通过共享中间参数而不是真实的用户项目交互数据来联合训练全局推荐模型,这对隐私保护推荐系统迈出了重要的一步。然而,好奇的服务器仍然可以从上传的中间参数推断用户评分和用户交互行为。此外,FedRS 在整合辅助信息(例如社会特征)以提高推荐性能时也面临隐私泄露的风险。

挑战 2: FedRS的安全攻击

        在联邦推荐场景中,参与者可能是恶意的,他们可以毒害他们的本地训练样本或上传的中间参数来攻击FedRS的安全性。它们可以增加特定产品的利润暴露,或破坏竞争公司的整体推荐性能。为了确保推荐的公平性和性能,FedRS必须具备检测和防御参与者毒害攻击的能力。

挑战 3:FedRS 的异质性

        FedRS 还面临多个客户端协作训练期间系统异质性、统计异质性和隐私异质性的问题。当在本地训练推荐模型时,由于存储、计算和通信能力的差异,能力有限的客户端可能会成为掉队者,进而影响训练效率。此外,不同客户端的数据(例如,用户属性、评级和交互行为)通常不独立且同分布(Non-IID),为所有用户训练一致的全局推荐模型无法达到推荐结果的个性化。此外,在实际应用中,用户往往有不同的隐私需求,采用不同的隐私设置。所以简单地使用相同的隐私策略可能会给用户带来不必要的推荐精度和效率损失。

二、联邦推荐系统概述

1. 通信架构

        在 FedRS 中,参与者的数据在本地存储,中间参数在服务器和参与者之间进行通信。FedRS 研究中使用了两种主要的通信架构,包括客户端服务器架构和点对点架构。

        

客户端-服务器架构

        客户端-服务器架构是 FedRS 中使用的最常见的通信架构,如图 1(a) 所示,它依赖于受信任的中央服务器来执行初始化和模型聚合任务。在每一轮中,服务器将当前的全局推荐模型分发给一些选定的客户端。然后所选客户端使用接收到的模型和自己的数据进行本地训练,并将更新后的中间参数(如模型参数、梯度)发送到服务器进行全局聚合。客户端-服务器架构需要一个中央服务器来聚合客户端上传的中间参数。因此,一旦服务器具有单点故障,整个训练过程将受到严重影响。此外,好奇的服务器可以通过中间参数推断客户的隐私信息,留下潜在的隐私问题。

Peer-Peer 架构

        考虑到FedRS中客户端-服务器架构的单点故障问题,Hegedset等人[21]设计了一种不涉及通信过程的中央服务器的点对点通信体系结构,如图1(b)所示。在每一轮通信中,每个参与者将更新后的中间参数广播给对等网络中的一些随机在线邻居,并将接收到的参数聚合到自己的全局模型中。在此架构中,可以避免与中央服务器相关的单点故障和隐私问题。然而,聚合过程发生在每个客户端上,这大大增加了客户端的通信和计算开销。

2. 分类

参与者类型

        基于参与者的类型,FedRS可以分为跨设备FedRS和跨平台FedRS。

1)跨设备的参与者:跨设备的参与者指的是联邦学习设置中的客户端为每个移动用户,这种模型的特点是,参数者数量众多,但是每个参与者的数据量很小。同时,考虑到移动设备的计算能力和通信能力有限,跨设备FedRS无法处理非常复杂的训练任务。此外,由于功率和网络状态,移动设备可能会退出训练过程。因此,跨设备 FedRS 的主要挑战是如何在训练过程中提高效率处理设备的掉队问题

2)跨平台的参与者:跨平台的参与者一般是指不同企业或者平台的数据,例如,为了提高推荐性能,推荐系统经常整合来自多个平台(如商业平台、社交平台)的数据。然而,由于隐私和监管问题,不同的数据平台往往不能直接相互共享他们的数据。在这种情况下,跨平台 FedRS 可用于协作训练不同数据平台之间的推荐模型,而无需直接交换用户的数据。与跨设备FedRS相比,跨平台FedRS的参与者数量相对较小,每个参与者拥有相对大量的数据。跨平台FedRS的一个重要挑战是如何设计一个公平的激励机制来衡量不同数据平台的贡献和好处。此外,很难找到受信任的服务器来管理跨平台 FedRS 中的训练过程,因此在这种情况下,点对点通信架构的对等可能是一个好的选择。

推荐模型类型

        根据FedRS中使用的不同推荐模型,FedRS可分为基于矩阵分解的FedRS、基于深度学习的FedRS和基于元学习的FedRS。

1)基于矩阵分解的联邦推荐模型

        在基于矩阵分解模型的FedRS中,用户因子向量在客户端上本地存储和更新,只有项目因子向量[29]或项目因子向量的梯度[23][10][9][30]上传到服务器进行聚合。基于矩阵分解模型的 FedRS 可以简单地有效地捕捉用户品味,以及用户和项目之间的交互和评级信息。然而,它仍然有许多限制,例如稀疏性(要预测的评级数量远小于已知的评级)和冷启动(新用户和新项目缺乏评级)问题。

2)基于深度学习的FedRS

        为了学习用户和项目的更复杂的表示并提高推荐性能,深度学习技术已广泛应用于推荐系统。然而,由于隐私法规更加严格,推荐系统很难收集足够的用户数据来构建高性能的深度学习模型。为了在满足隐私法规的同时充分利用用户数据,人们提出了许多有效的基于深度学习的FedRS。考虑到模型结构不同,基于深度学习的FedRS通常采用不同的模型更新和中间参数传输过程。例如,Perifanis等人[31]提出了一种基于NCF[34]的联合神

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值