作者 | 章磊
责编 | Aholiab
出品 | 优快云、ARPA
在越来越多对数据隐私的担忧声中,政府开始行动制定数据使用合规法案。而另一方面,对数据的保护,却产生了一个矛盾:大量的数据因为需要依法保护而无法被联合在一起计算。
反过来试想一下,如果全世界的基因数据能够联合在一起分析,人类或许可以更快找到癌症的解药。这让我们大胆地去思考,是否存在一种保护数据安全而又能够有效利用数据的方式?
1980年代,姚期智院士提出了「百万富翁」问题:两个百万富翁街头邂逅,他们都想炫一下富,比比谁更有钱,但是出于隐私,都不想让对方知道自己到底拥有多少财富,如何在不借助第三方的情况下,让他们知道他们之间谁更有钱?
在这个经典问题之下,诞生了「多方安全计算」(Multiparty Computation, MPC)这门密码学分支。MPC技术能够让数据在不泄露的情况下联合多方的数据进行联合计算并得到明文计算结果,最终实现数据的所有权和数据使用权的分离。
今天我们就来介绍一下MPC的出现背景和应用场景。在开始前,我们先来看看如今数据对于我们的意义。
我们正生活在数据保护的时代
个人隐私和数据隐私
2018 年 5 月 25 日正式生效的欧盟通用数据保护条例(GDPR)引起全球广泛关注,这部被称为「史上最严」的数据保护法案将对科技行业和个人生活产生深远影响,因为它是人类历史上第一个定义个人数据所有权的规则,它在法律上明确规定了个人数据是个人所有的数据资产。
这项法律将保障人们对个人数据有更多的掌控权。举例说明,社交网络公司在使用你的数据前必须征得你的同意。此项法律对创Facebook等科技巨头无疑影响很大,因为这些公司就指望着用户数据赚钱。
商业利益中的数据保护
数据是现代商业与个人的核心价值与重要资产。数据正在重新塑造人类生活的方方面面,包括 金融、广告、零售、医疗、物流、能源和工业等。
随着人工智能时代的到来,数据在现代商业活动中也成为了最重要的竞争资源。巨头公司利用数据垄断的优势建筑起了行业壁垒。
例如,打车软件公司拥有人们每天出行的数据,包括乘客的起点与终点,他们可以利用这些数据来优化自己的产品和业务,甚至是用这些数据来进行一些预测,比如一个房地产价格指数或者一个政府道路优化方案。
数据的融合可提高其价值,数据的交叉使用可产生协同作用。但因为数据本身的可复制性和易传播性,一经分享无法追踪使用情况,数据资产的分享与协同开发受到严重制约。
既然如此,那数据保护的价值又从何说起呢?
被保护的数据如何产生价值?
虽然个人对隐私的保护、商业公司的数据保护,都是正当的利益诉求,但却产生了一个个数据孤岛。拥有数据源的中小型公司无法安全的将数据共享或变现。
对于数据使用者,大数据公司、开发者和科学家仅能接触到有限的数据集,并且费用高昂。与运营商等大数据源的合作需要开发人员现场部署模型于数据源的服务器上,模型算法存在泄露风险,且效率低下。
一方面,数据需要得到保护和隔离;另一方面,数据对人类社会的价值在于联合在一起的计算和分析