加密语音流中的说话人识别
1. 引言
过去几十年,我们的生活和工作方式发生了巨大变化。联网设备的普及和信息交换的增多带来了机遇,但也给相关系统和程序的设计与分析带来了挑战。如今,人们对在开放基础设施(如无线通信渠道或互联网)上运行的协议需求不断增加,这些协议能让不同人随时随地进行远程通信。然而,在开放基础设施上传输隐私敏感信息会引发严重的隐私问题。
现代语音通信协议通常需要满足保密性(语音通信内容对窃听者保密)和匿名性(语音通信用户对窃听者匿名)等安全属性。为实现这些属性,语音通信一般会进行加密。例如,基于GSM和UMTS标准的电话会对语音数据加密,大多数VoIP电话也会在应用层提供加密或支持IPsec。但即便正确部署了加密,语音通信协议的其他特性仍可能让窃听者获取通信内容和说话人信息。
2. 研究贡献
我们开发了一种新方法,仅通过监听加密流量就能揭示参与加密语音通信的说话人身份。该方法利用了语音活动检测(VAD)技术,这是一种常用的降低语音流量带宽消耗的技术。许多标准在传输语音流时会使用基于VAD的技术来减少传输数据量。比如,GSM和UMTS标准使用不连续传输(DTX)技术,当说话人空闲时停止传输,节省电池电量并减少干扰;Skype、Google Talk等VoIP客户端以及美国陆军的陆地勇士系统,在说话人空闲时会减少数据包数量和/或大小,降低网络利用率。
即使流量被加密,VAD技术导致的流量减少也会在流量中形成模式,进而揭示底层语音流中的停顿模式。这些模式具有说话人特征,足以破坏加密语音通信中说话人的匿名性。
我们的方法基于监督学习,具体步骤如下:
- 准备阶段 :
超级会员免费看
订阅专栏 解锁全文
1340

被折叠的 条评论
为什么被折叠?



