《NTP-VFL - A New Scheme for Non-3rd Party Vertical Federated Learning》模型原理

最新推荐文章于 2024-12-24 21:57:03 发布

原创最新推荐文章于 2024-12-24 21:57:03 发布 · 396 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#联邦学习 #LR算法 #Non-3rd

人工智能专栏收录该内容

68 篇文章

订阅专栏

本文介绍了一种无需第三方的联邦学习LR算法，利用同态加密处理数据隐私。通过泰勒展开和最小批量SGD，实现在多方模型训练中的安全计算，确保通信和计算成本的有效管理。

一、概要

目前现存算法的三个局限性：

理论上的可信三方现实不存在，通常是联邦学习的主要瓶颈。
通信和计算成本随着迭代次数的提升，增长很快。
扩展性不好，隐私保护的最优模型在两方和多方中不兼容。

本文提出一个没有第三方的联邦学习LR算法，使用同态加密计算，该算法允许多方模型训练，并保证数据隐私。使用泰勒展开式作为梯度的近似形式和使用最小批量SGD更新参数训练模型。

二、模型详情

1、推导逻辑回归模型：
$P(y=1|X)=\frac{1}{1+e^{-w^Tx}}$
通过将y标转换成{-1,1}，可以得到似然函数如下：
$L(w)=\prod_{i=1}^m(\frac{1}{1+e^{-y_iw^Tx}})$
取对数，得到log损失函数：
$-\frac{1}{m}ln(L(w))=\frac{1}{m}\sum_{i=1}^mln(1+e^{-y_iw^Tx})$
加密后的安全loss:
$\frac{1}{m}\sum_{i=1}^mln(1+e^{[[-y_iw^Tx]]})$
对 $ln(1+e^{-z})$ 进行在0处的泰勒展开：
$ln(1+e^{-z}) \approx ln2-\frac{1}{2}z+\frac{1}{8}z^2$
将其带入loss函数：
$\approx \frac{1}{m}\sum_{i=1}^m(ln2-\frac{1}{2}y_iw^Tx+\frac{1}{8}(w^Tx)^2)$
最后得到梯度：
$g_{w_j}=\frac{1}{m}\sum_{i=1}^m(-\frac{1}{2}y_i+\frac{1}{4}(w^Tx_i))x_i^j$
加密计算公式：
$g_{w_j}=\frac{1}{m}\sum_{i=1}^m([[-\frac{1}{2}y_i+\frac{1}{4}(w^Tx_i)]])x_i^j$

2、模型训练过程：
假设各方为A，Bs，C，其中Bs为可以扩展为多方的设计，A方生成密钥对，并将公钥发送给Bs和C。
各方计算本方的 $[y]$ ：

C接收各方发送 $的 [y]$ ，并作如下计算：

B接收 $y_{forward}]$ 计算 $g_{Bs}+R_{Bs}]$ 发送给A。
A接收B和C发送的 $g_{forward}],[gwx]^*,[g_{Bs}+R_{Bs}],[g_C+R_C]$ ，并作如下计算：

将 $g_{Bs}+R_{Bs}$ , $g_C+R_C$ 分别发送给B和C，然后各方更新各自的权重。