智能语音处理技术在可疑语音通话识别中的应用
1. 引言
随着科技的不断发展,人们从网络中享受着各种各样的服务。2018 年,全球互联网用户接近 40 亿(约占 77 亿世界人口的一半),而 2015 年仅为 20 亿。然而,人们的私人信息也在逐渐泄露,网络犯罪如同街头犯罪一样不断演变。如果个人隐私被攻击者掌握,就可能成为电信诈骗的目标。2019 年的最新统计显示,为了检测可疑电话,目前大多数方法是基于标记被客户识别为垃圾邮件的主叫号码,也有许多研究人员使用机器学习等技术来检测诈骗电话。
我们提出的工作主要目标是提醒移动用户防范垃圾电话,保护他们的凭证信息不被网络犯罪分子窃取。
1.1 范围
如今,大多数网上银行用户在不知不觉中将自己的凭证信息提供给了不可信的一方,尤其是那些未受过教育和缺乏意识的人更容易遇到此类问题。我们提出的语音处理技术可以在不可信方提及凭证信息时向用户发出警报或风险通知。通过机器学习技术,即使用户没有意识到通话是欺诈性的,应用程序也能自动检测并提醒用户断开通话。
1.2 局限性
该项目存在一些局限性:
- 语音需要清晰响亮。
- 手机需要预装谷歌语音转文本 API(所有支持谷歌的手机都预装了该 API)。
- 只有当句子中至少包含数据集中的 2 个可疑单词时,用户才会收到可疑通话的警报。
- 虽然使用谷歌 API 不需要互联网,但需要良好的网络以确保语音清晰。
- 多语言和词汇的多样性是识别可疑单词的关键问题,并且需要大量数据集来训练 HMM 模型。
2. 文献综述
以下是一些相关的研究成果:
超级会员免费看
订阅专栏 解锁全文
393

被折叠的 条评论
为什么被折叠?



