手机是否在监听?可行性与可检测性分析
1. 实验研究发现
关于非声学智能手机传感器能否捕捉正常对话音量的声音,存在对立观点。一些研究未发现人类实时语音对运动传感器有明显影响,但也有研究报告称机器合成语音对传感器有微小但可测量的影响,足以重构口语词汇或短语。
以色列国防技术集团拉斐尔和斯坦福大学的研究人员仅使用智能手机陀螺仪,就能捕捉到丰富的声学信号,从而识别说话者的性别、区分不同说话者,并在一定程度上追踪所说内容。张等人的类似实验也表明,即使存在环境噪音和用户移动,也能从智能手机加速度计读数中实时推断出所说的话,其准确率与基于麦克风的热词检测应用相当。
然而,这些研究存在显著局限性:
- 算法只能检测一小部分预定义的关键词,而非进行完整的语音识别。
- 实验中的语音由扬声器或手机扬声器产生,可能与人类实时语音的声学特性不同。
- 部分实验中播放设备和记录智能手机共用一个表面,有人认为传感器读数的变化是由表面直接振动而非空气声波引起的。
- 某些方法的识别准确率较低,特别是在独立于说话者的热词检测方面。
此外,已经有通过运动传感器捕捉声学信号的方法申请了专利,如“使用加速度计检测用户语音活动的方法”和“使用移动设备中的加速度计检测热词的系统”。
2. 采样频率限制
为了限制能耗,且智能手机运动传感器的典型应用不需要高采样数据,当前移动操作系统对运动传感器的采样频率设置了上限。例如,安卓系统中加速度计读数的最大采样频率为 200 Hz,iOS 系统中陀螺仪的最大采样频率为 100 Hz。而人类说话声音的基频,男性通常在 85 Hz 至 155 Hz 之间,女性在 165 Hz 至
手机监听可行性与可检测性分析
超级会员免费看
订阅专栏 解锁全文
1590

被折叠的 条评论
为什么被折叠?



