云环境下加密数据的安全朴素贝叶斯分类及数据持有证明方案
云服务与数据安全背景
在当今数字化时代,云服务凭借其快速部署、动态分配资源和降低成本等显著优势,正变得越来越流行。个人和组织纷纷将大量数据集集中存储到云服务提供商(如亚马逊、谷歌、微软)提供的按使用付费的存储空间中。然而,将数据外包到远程云意味着直接物理控制权的转移,这引发了人们对数据安全和隐私的担忧。为了保护敏感信息,数据所有者在上传数据之前通常会对其进行加密。
但加密也带来了新的问题,它会阻碍对云中外包数据集的分析和计算。例如,用户希望利用云服务器强大的计算能力来分析存储在云中的数据,以提取有益的知识和模式,但加密会影响查询和分析的功能和性能。
朴素贝叶斯分类概述
朴素贝叶斯分类是一种有效的算法,用于预测未分类样本的类别标签,特别适用于高维数据分类任务,如推荐系统、文本分类和医疗数据分析。
假设 $S$ 是一个未分类样本,可表示为 $d$ 维向量 $S = (S_1, S_2, \cdots, S_d)$,类别标签的域为 ${1, 2, \cdots, \lambda}$,用 $C_S$ 表示 $S$ 的类别标签。朴素贝叶斯分类通过以下步骤预测 $C_S$:
1. 预测 $C_S$ 为具有最高后验概率的类别,即 $C_S = \arg\max_{1\leq i\leq\lambda}(P(C_S = i|S))$。
2. 根据贝叶斯定理,$P(C_S = i|S) = \frac{P(S|C_S = i)P(C_S = i)}{P(S)}$。由于 $P(S)$ 对于每个类别标签 $i$ 都是相同的,所以 $C_S = \arg\max_{1\leq i\leq\lamb
超级会员免费看
订阅专栏 解锁全文

673

被折叠的 条评论
为什么被折叠?



