面向产品的新一代端到端唤醒框架 wekws 正式发布

WeNet社区发布wekws,这是一个针对语音唤醒的产品级端到端开源框架。它具备产品优先、端到端、轻量级及高准确率的特点,支持多样化的部署平台。

WeNet 开源社区正式发布 wekws,面向产品的新一代端到端唤醒框架。该工作在西北工业大学航海学院张晓雷老师团队、西工大音频语音与语言处理研究组谢磊老师团队的支持下完成。wekws 具有如下产品优先端到端轻量级高准确率四大优点。

目前该工作已经投稿 ICASSP 2023。

  论文地址为:https://arxiv.org/pdf/2210.16743.pdf

为什么要做 wekws?

语音唤醒在日常生活领域已经有了非常广泛的应用,例如手机上的个人助手 Siri,智能音箱上的小爱同学、天猫精灵,智能汽车中的你好小迪(比亚迪)、理想同学(理想汽车)等等的场景。然而实际工业界在落地唤醒时,确有如下突出问题:

  1. 方法众多:有 HMM Filler,有 Deep KWS[1],有类端到端方法,训练损失函数上有 CE、有 CTC、有 RNN-T、也有 max-pooling 等。复杂的方法增加了大家调研、选择和学习的成本,并且部分方法训练和部署难度大。

  2. 部署的芯片和平台众多:唤醒部署的芯片和硬件平台非常的多样化,很多平台需要独立适配,工作量大、成本高

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值