本文来自WIRED
苹果和谷歌两家公司透露,他们的手机升级可以保护数据,减少对云计算的依赖,并还将用户与其生态系统更紧密地结合在一起。
自从iPhone问世以来,智能手机变得越来越智能。移动应用程序将用户数据发送到cloudward,用于转录语音或建议回复消息等有用任务。现在苹果和谷歌表示,智能手机足够聪明,可以独立完成一些关键而敏感的机器学习任务。
在本月的苹果全球开发者大会(WWDC)上,该公司表示,在近期和未来的iphone和ipad上,其虚拟助手Siri将在不通过云计算的情况下用某些语言转录语音。在上个月的I/O开发者大会上,谷歌表示,最新版本的Android操作系统有一个专门用于敏感数据的安全设备内处理的功能,称为私人计算核心(Private Compute Core)。它最初的用途包括为内置在手机键盘上的智能回复功能提供支持,该功能可以对收到的信息提出回复建议。
苹果和谷歌都表示,设备上的机器学习提供了更多的隐私和更快捷的应用程序。不传输个人数据降低了暴露的风险,节省了等待数据通过互联网的时间。同时,将数据保存在设备上符合科技巨头的长期利益,即让消费者融入他们的生态系统。用户如果听到自己的数据可以更私密地处理的人可能更愿意同意共享更多的数据。
这些公司最近在设备上机器学习方面的推广是在多年的技术工作之后进行的,以限制他们的云可以“看到”的数据。
2014年,谷歌开始通过一种名为差异隐私的技术收集有关Chrome浏览器使用情况的数据,这种技术会给收集到的数据增加干扰,从而限制这些数据所包含的个人信息。苹果公司利用这项技术从手机中收集数据,以通知表情符号和输入预测,并用于网络浏览数据。
最近,两家公司都采用了一种名为 federated learning的技术。它允许基于云的机器学习系统在不获取原始数据的情况下进行更新;相反,各个设备在本地处理数据,只共享经过整理的更新。与差异隐私一样,两家公司只在有限的情况下讨论过使用 federated learning。谷歌使用这种技术来保持其移动打字预测与语言趋势同步;苹果公司已经发表了关于使用它来更新语音识别模型的研究。
哥伦比亚大学助理教授Rachel Cummings此前曾为苹果公司提供隐私方面的咨询。她表示,在手机上进行机器学习的快速转变令人震惊。“在这么短的时间里,看到一些东西从最初的概念发展到大规模部署,这是非常罕见的。”
这种进步不仅需要计算机科学的进步,还需要企业承担在消费者拥有的设备上处理数据的实际挑战。谷歌表示,其federated learning系统只在用户插电、空闲和有免费网络连接时才会对其设备进行监听。这项技术的实现部分得益于移动处理器能力的提高。
更强大的移动硬件也促成了谷歌在2019年宣布,其Pixel设备上的虚拟助手的语音识别将完全在设备上,完全摆脱云的依赖。苹果在本月的全球开发者大会(WWDC)上宣布了新的设备上的Siri语音识别技术,该技术将利用该公司添加到其移动处理器中的“神经引擎”来增强机器学习算法。
技术上的成就令人印象深刻。它们将在多大程度上有效地改变用户与科技巨头的关系还有待商榷。
苹果全球开发者大会(WWDC)上的发言人称,Siri的新设计是“对隐私的重大更新”,解决了将音频意外传输到云端的风险,并表示这是用户对语音助手最大的隐私担忧。Siri的一些命令——比如设置定时器——可以完全在本地识别,从而做出快速响应。然而在很多情况下,发送给siri的转录命令——可能包括意外录制的命令——将被发送到苹果服务器,由软件进行解码和响应。对于通常安装在卧室和厨房的HomePod智能扬声器来说,Siri语音转录仍将是基于云计算的,在这些地方,意外录音可能更令人担忧。
“隐私与保持数据机密相混淆,但它也与限制权力有关。”
谷歌还将设备内数据处理作为隐私方面的一大优势加以推广,并表示将扩大这种做法。谷歌预计,三星等使用其Android操作系统的合作伙伴将采用新的隐私计算核心(Privacy Compute Core),并将其用于依赖敏感数据的功能。
谷歌还将对浏览数据的本地分析作为其重新设计在线广告目标的提案的一个特色,该提案被称为FLoC,并声称该提案更为私密。学者和一些竞争对手的科技公司表示,这种设计可能有助于谷歌巩固其在在线广告领域的主导地位,让其他公司更难瞄准目标。
伦敦大学学院(University College London)数字版权讲师Michael Veale表示,设备内数据处理可能是一件好事,但他补充称,科技公司推广它的方式表明,它们的主要动机是希望让人们与有利可图的数字生态系统联系在一起。
Veale说:“隐私和保持数据机密混淆了,但它也限制了权力。”“如果你是一家大型科技公司,并设法将隐私重新定义为只对数据保密,那就能让你继续正常经营,并获得运营许可。”
谷歌的一位发言人表示,公司“在计算发生的任何地方都要保护隐私”,发送到私人计算核心进行处理的数据“需要与用户价值挂钩”。苹果没有回应记者的置评请求。
哥伦比亚大学的Cummings表示,新的隐私技术和公司营销它们的方式,增加了数字生活权衡的复杂性。近年来,随着机器学习的应用越来越广泛,科技公司收集和分析的数据范围也在稳步扩大。有证据表明,一些消费者误解了科技巨头鼓吹的隐私保护。
卡明斯和波士顿大学和马克斯·普朗克研究所的合作者即将进行的一项调查研究显示,从科技公司、媒体和学者到675名美国人,他们对不同的隐私进行了描述。听到这项技术后,人们愿意分享数据的可能性增加了一倍。但有证据表明,对不同隐私的受益的描述也鼓励了不切实际的期望。五分之一的受访者希望他们的数据不会受到执法部门搜查的保护,但差异隐私却没有做到这一点。苹果和谷歌关于设备内数据处理的最新声明可能会带来新的误解机会。