基于同态加密的隐私计算技术在基因序列演化分析场景的应用

本文探讨了如何利用基于同态加密的隐私计算技术,在不泄露原始数据的前提下,对新冠病毒基因序列进行演化分析。通过全同态加密算法CKKS,实现了在无可信第三方参与的情况下,保障数据安全的基因关系结构分析,为疫情风险评估和医疗方案制定提供支持。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、概述

数据要素的流通共享和核心价值挖掘是数据要素市场培育的核心内容、必须在保证隐私安全的前提下实现有效信息共享。然而,当前仍然有三大隐私制约数据流通与协作。一是“数据孤岛”现象普遍存在,“数据孤岛”的出现使数据共享和流通协作受到阻碍,导致数据要素在资产化过程中发生垄断;二是全球数据合规监管日趋严格,日前各个国家都才采取数据安全法,确立了数据安全保护的各项基本制度,导致企事业及个人对数据流通与协作合法合规的担忧;三是隐私泄露事件频发导致信任鸿沟,各个应用软件为了商业变现对个人隐私的侵犯无处不在,导致我们越来越不信任软件的各种安全验证。

近年来,全球新冠肺炎确诊病例逾千万,且仍以每天30万新增病例飙升,一些发展中国家 正在成为新“震中”,形势堪忧。新冠病毒毒性大,隐密性、变异性强,扩散快,稍有松懈便可酿成大患,对新型冠状病毒基因组演化的分析能够为全面评估疫情风险、启动公共卫生应对措施及制定医疗方案提供有效的数据支撑。本文使用基于同态加密的隐私计算技术对新冠病毒基因序列演化进行分析,使在不泄露原始数据的前提下,采取多方不同机构的病毒数据源对基因序列进行综合分析,进而达到快速定位新变种基因的种族归簇问题。

二、相关工作

隐私计算是在保证数据提供方不泄露敏感数据的前提下,对数据进行计算并能验证计算结果的技术。在大数据时代能够打破数据孤岛,既能保护数据隐私安全、防止敏感信息泄露的同时又能实现海量数据流动。隐私计算经过近几十年的发展、目前在产业互联网、人工智能、金融科技、医疗保护共享数据等方面发挥着重要的作用。而现有的隐私保护主要从信息处理过程、隐私度量与评估两个方面入手,其技术主要分为访问控制技术、信息混淆技术方法、密码学技术方法,但是以上方案主要是针对特征场景局部数据集的具体算法,缺少针对各种场景的普适性算法框架。

隐私计算的提出解决了上述问题,隐私计算可分为联邦学习(Federated Learning,FL)、同态加密(Homomorphic Encryption,HE)、多方安全计算(Secure Multi-Party Computation,SMPC)、基于可信计算(Trust Execution Environment,TEE)、差分隐私(Differential Privacy,DP)等技术。

可信执行环境(Trust Execution Environment,TEE)通过硬件技术来对数据进行隔离保护,将数据分类处理。支持TEE的CPU中,会有一个特定的区域,该区域的作用是给数据和代码的执行提供一个更安全的空间,并保证它们的机密性和完整性。典型场景包联合建模、区块链、intel的SGX等

联邦学习(Federated Learning,FL)是近些年新崛起的新兴人工智能技术,在2016年由谷歌最先提出,保证数据不出安全控制范围,保护终端数据和个人数据隐私的前提下,实现多个参与方或多个计算节点之间开展高效率的机器学习。联邦学习的典型场景有金融联合风控、联合营销、联合画像等。

安全多方计算(Secure Multi-Party Computation,SMPC)解决的是一组相互不信任的参与方各自拥有秘密数据,协同计算一个既定函数的问题。参与方除了获得计算结果,无法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI研究员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值