1. 水平联邦学习(Horizontal Federated Learning, HFL)
-
解释:
想象不同的公司(比如几家银行)都拥有类似类型的客户数据,比如用户的年龄、职业和消费记录。每个公司都有一部分不同的客户,但他们的用户数据格式和特征是相同的。这种情况下,数据是在“横向”分布的——每个客户端拥有的都是来自不同人的同样类型的数据。 -
应用场景:适用于用户特征相同、用户群体不同的场景,比如几家银行之间合作构建一个信用评分模型。
2. 垂直联邦学习(Vertical Federated Learning, VFL)
-
解释:
想象两家公司,比如一家银行和一家电商公司。银行拥有用户的金融数据,比如收入、贷款记录;电商公司则拥有用户的购买记录和消费习惯。这两家公司服务的用户可能有重叠部分,但它们的数据类型完全不同。这种情况下,数据是在“纵向”分布的——每个客户端拥有相同用户的不同类型数据。 -
应用场景:适用于企业合作分析同一组用户的数据,比如联合分析用户的消费能力和购买偏好。
3. 联邦迁移学习(Federated Transfer Learning, FTL)
-
解释:
想象一家医院和一所大学。医院有患者的病历数据,但没有学生的学术数据;大学有学生的学术数据,但没有患者的病历信息。而这两者几乎没有重叠用户,也就是用户数据完全不同。这种情况下,联邦迁移学习通过“迁移学习”技术,将知识从一个客户端转移到另一个客户端,帮助两方共同训练一个模型。 -
应用场景:适用于用户群体不同、数据类型不同的场景,比如医院和大学合作开发一个预测学生健康风险的模型。
对比表格
特性 | 水平联邦学习(HFL) | 垂直联邦学习(VFL) | 联邦迁移学习(FTL) |
---|---|---|---|
数据分布 | 不同客户端拥有相同类型的数据,不同用户 | 不同客户端拥有不同类型的数据,相同用户 | 不同客户端拥有不同类型数据,不同用户 |
数据特征 | 数据特征相同 | 数据特征不同 | 数据特征不同 |
用户群体 | 不同的用户群体 | 有部分用户群体重叠 | 用户群体完全不同 |
应用场景 | 银行间的信用评分模型合作 | 银行与电商的用户联合分析 | 医院与大学的健康风险预测合作 |
核心目标 | 共享模型,增强模型的泛化能力 | 共享特定用户的数据特征 | 跨领域迁移知识,提升模型能力 |
总结
- 水平联邦学习适合处理同类型数据、不同用户的场景;
- 垂直联邦学习适合处理不同类型数据、相同用户的场景;
- 联邦迁移学习则适合处理完全不同用户和数据的场景,通过迁移学习技术实现模型的共享知识。