语音识别技术在欺诈检测与发音训练中的应用
1. 语音识别在欺诈检测中的应用
在食品配送平台 Swiggy 的欺诈检测场景中,语音识别技术发挥了重要作用。其欺诈检测系统主要基于配送员与客户的通话语音数据进行分析。
1.1 数据处理与模型构建
- 短语提取 :基于余弦相似度和最大边际相关性提取顶级短语,以确保短语的多样性。将每个自动语音识别(ASR)输出提取的短语与实际 ASR 输出拼接,然后输入到堆叠的双向长短期记忆网络(BiLSTM)中。这样做是为了让 BiLSTM 层更关注 ASR 输出中的相关关键词,因为这些关键词会同时出现在短语和实际文本中。
- 模型结构 :四层 BiLSTM 层相互堆叠,然后输入到全连接的密集层进行欺诈和非欺诈的二分类。
1.2 数据库情况
- 收集了配送员和客户数月的语音对话数据用于分析配送员欺诈系统。Swiggy 的信任与安全团队每天手动听取通话并从客户处获得确认,以标记配送员为欺诈或非欺诈。
- 对于基于规则的系统,考虑了 1756 个订单 ID 并预测了所有订单 ID 的欺诈/非欺诈标签。在开发自然语言处理(NLP)驱动的建模方法时,使用 3069 个订单 ID 相关数据进行训练,1219 个订单 ID 作为测试集。
1.3 不同规则系统的评估
| 逻辑 | 类别 | 支持度 | <
|---|
超级会员免费看
订阅专栏 解锁全文
2198

被折叠的 条评论
为什么被折叠?



