基于Kd树的隐私保护外包K-means聚类方案
1. 引言
近年来,云计算发展迅速,为现实应用带来诸多好处,如资源弹性、文件存储和外包计算等。很多资源受限的用户会将机器学习任务外包给云服务器以节省成本。然而,金融、医疗等领域的用户数据和中间结果敏感,外包计算会因云服务器不可信而面临安全挑战。
K-means聚类是常用的数据分析和挖掘技术,在医疗影像诊断和市场细分等领域应用广泛。为保障云计算中的数据安全,可使用同态加密(HE)和秘密共享(SS)等加密工具。此前已有很多解决隐私保护K-means聚类问题的方案,但部分方案效率高但安全性不足,部分方案安全但计算和通信开销大。
为兼顾效率和数据安全,我们提出基于Kd树的隐私保护K-means聚类方案,该方案不仅高效,而且安全,在实际应用中具有重要意义。
1.1 主要贡献
- 利用秘密共享技术和百万富翁协议,设计了一套安全协议,可隐私保护地查找最小值、计算欧几里得距离和比较密文。基于这些子协议,提出了一种新的隐私保护外包K-means聚类(PPOKC)方案,能在Kd树数据结构上高效执行外包K-means聚类。
- 使用Kd树存储数据,减少冗余计算,提高效率。所有中间值都得到安全保护,用户构建Kd树并上传数据后可离线,该方案最小化了用户的计算和通信开销,满足资源受限用户的需求。
- 在多个真实和合成数据集上测试方案性能,并与相关工作进行比较。实验结果表明,该方案与现有方案效率相当,但安全级别更高。
2. 预备知识
2.1 加法秘密共享
为实现隐私和效率,采用秘密共享(S
超级会员免费看
订阅专栏 解锁全文

26

被折叠的 条评论
为什么被折叠?



