差分隐私——高斯机制(The Gaussian Mechanism)

最新推荐文章于 2025-03-23 13:48:39 发布

夏季八起

最新推荐文章于 2025-03-23 13:48:39 发布

阅读量1.1w

点赞数 11

文章标签：概率论机器学习算法

本文链接：https://blog.youkuaiyun.com/m0_43424329/article/details/121650574

版权

本文解析了Dwork女士著作中关于高斯机制的(ε, δ)-差分隐私定义，探讨了隐私损失函数的计算与(ε, δ)-DP的证明过程，并解释了σ=cΔf/ε的形式及c的上限。涉及关键概念如查询函数、邻域数据集和高斯噪声的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近实验室的师弟汇报高斯机制，自己也经常遇到，所以学习一下。本文来自Dwork女士的《The Algorithmic Foundations of Differential Privacy》的附录A，其中有一些细节没有看懂，期盼有明白的同学能够给予解答，同时也希望能指出本文存在的错误。

高斯机制

$(\epsilon, \delta)-DP$

定义一：(隐私损失 privacy loss)对于两个相邻的数据集 $D, D^{'}$ （即 $D-D'||_1=1$ )，输出 $o$ 和随机函数 $M$ ，该随机函数造成的隐私损失 $c_M(o,D,D')$ 定义为 $c_M(o,D,D'):=ln\frac{Pr[M(D)=o]}{Pr[M(D')=o]}$
定理一：随机函数 $M$ 是 $(\epsilon, \delta)$ -DP 的充分条件是其隐私损失 $c_M(o,D,D')$ 满足 $Pr[c_M(o,D,D')>\epsilon]\leq\delta$

证明：定义 $B=\{o:c_M(o,D,D')>\epsilon\}$
$\begin{aligned} Pr[M(D) \in S]&=Pr[M(D)\in S\cap B] + Pr[M(D)\in (S-B)] \\ &\leq Pr[M(D)\in B]+Pr[M(D)\in(S-B)] \\ &\leq Pr[M(D)\in B]+e^\epsilon Pr[M(D')\in(S-B)]\\ &\leq Pr[M(D)\in B]+e^\epsilon Pr[M(D')\in S] \\ \end{aligned}$
如果 $Pr[c_M(o,D,D')>\epsilon]<\delta$ ,
则Pr[M(D) $\in$ S] $\leq$ Pr[M(D) $\in$ B] + e $^\epsilon$ Pr[M(D’) $\in$ S].
即算法M满足 $(\epsilon,\delta)-DP$ .
说明： $(\epsilon, \delta)-DP$ 的充分条件是隐私损失被限制在 $\epsilon$ 之内，同时也允许很小的概率 $\delta$ 打破这个限制。
在这里插入图片描述其中 $\triangle_2f=max_{{adjacent}_{D,D'}}||f(D)-f(D')||_2$ ,f为查询函数。
$\begin{aligned} \frac{Pr[M(D)=o]}{Pr[M(D')=o]}&=\frac{Pr[f(D)+N=o]}{Pr[f(D')+N=o]}\\&=\frac{Pr[N=o-f(D)]}{Pr[N=o-f(D')]}\\&=\frac{e^{-{\frac{[o-f(D)]^2}{2\sigma^2}}}}{e^{-{\frac{[o-f(D')]^2}{2\sigma^2}}}}\\&=\frac{e^{-{\frac{[o-f(D)]^2}{2\sigma^2}}}}{e^{-\frac{[o-f(D)+\Delta f]^2}{2\sigma^2}}}\\&=\frac{e^{-{\frac{x^2}{2\sigma^2}}}}{e^{-\frac{(x+\Delta f)^2}{2\sigma^2}}} \end{aligned}$
由于概率恒正
$\begin{aligned} |ln\frac{e^{-{\frac{x^2}{2\sigma^2}}}}{e^{-\frac{(x+\Delta f)^2}{2\sigma^2}}}|&=|lne^{\frac{-1}{2\sigma^2}[x^2-(x+\Delta f)^2]}|\\&=|-\frac{1}{2\sigma^2}[x^2-(x^2+2x\Delta f +\Delta f^2)]|\\&=|\frac{1}{2\sigma^2}(2x\Delta f+(\Delta f)^2)|\\&<\epsilon \end{aligned}$
在这里插入图片描述
说明：书上少写了一个t
$\begin{aligned} Pr[x>t]&=\int_{t}^{\infty}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}}dx\\&\le-\frac{\sigma}{\sqrt{2\pi}}\int_{t}^{\infty}\frac{1}{t}e^{-\frac{x^2}{2\sigma^2}}d-\frac{x^2}{2\sigma^2}\\&\le\frac{\sigma}{\sqrt{2\pi}t}e^{-\frac{t^2}{2\sigma^2}} \end{aligned}$
在这里插入图片描述

$\begin{aligned} \frac{1}{2\sigma^2}(\frac{\sigma^2\epsilon}{\Delta f}-\frac{\Delta f}{2})^2&=\frac{1}{2\sigma^2}[\Delta f(\frac{c^2}{\epsilon}-\frac{1}{2})]^2\\&=[\Delta f(\frac{c^2}{\epsilon}-\frac{1}{2})]^2[\frac{\epsilon ^2}{c^2(\Delta f)^2}]\frac{1}{2}\\&=\frac{1}{2}(\frac{c^2}{\epsilon}-\frac{1}{2})^2\frac{\epsilon^2}{c^2}\\&=\frac{1}{2}(c^2-\epsilon+\epsilon^2/4c^2) \end{aligned}$
先讨论第一项 $ln((\sigma^2\epsilon/\Delta f-\Delta f/2)/\sigma)$ ,得出c的一个不太紧的界，由第二项 $(\sigma^2\epsilon/\Delta f-\Delta f/2)^2/2\sigma^2$ 得出一个关于c更紧的界(tighter)。不清楚 $c\ge1$ 这一条件怎么来的，由对数函数的性质可推出 $c\ge3/2$ .
在这里插入图片描述
这里能去掉第一项的原因是当 $c = 3 / 2$ 时，第一项为0；当 $c > 3 / 2$ 时，第一项大于0.故只留第二项这个不等式也是成立的.

证明结束.