云计算中隐私保护的噪声关键词搜索
在云计算环境下,数据的隐私保护至关重要。尤其是在进行关键词搜索时,如何在保护用户隐私的同时实现对噪声关键词的有效搜索,是一个具有挑战性的问题。本文将介绍相关的基础工具、通用框架以及具体的加密方案,并对方案的正确性和安全性进行分析。
1. 有用的工具
1.1 预备知识
- 概率分布表示 :若(X)是一个随机变量,为简便起见,用(X)表示该变量取值范围内的概率分布。用(U_l)表示长度为(l)的二进制字符串上的均匀分布。对于集合(A),符号(a \leftarrow_r A)表示(a)是从(A)中均匀随机选取的。对于矩阵(B),其秩记为(Rank(B))。
- 距离度量 :
- 汉明距离 :两个等长字符串之间的汉明距离是对应符号不同的位置数量。
- 编辑距离 :两个字符串之间的编辑距离是将一个字符串转换为另一个字符串所需的操作数量。
- 集合差 :两个集合的集合差是它们对称差的大小。
- 熵相关概念 :
- 最小熵 :随机变量(X)的最小熵(H_{\infty}(X)=-\log(\max_x Pr(X = x)))。最小熵至少为(m)的随机变量称为(m)源。
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



