13、自动语音识别系统与对话响应时机估计研究

自动语音识别系统与对话响应时机估计研究

在当今科技发展的浪潮中,自动语音识别(ASR)系统和对话响应时机的研究愈发重要。自动语音识别系统在医疗咨询等领域有着广泛应用,而对话系统中准确把握响应时机则是实现自然流畅对话的关键。

自动语音识别系统比较

在医疗咨询场景下,研究人员利用 EQClinic 平台开展了相关实验。
- 实验设置
- 参与者 :12 名二年级本科医学生(6 女 6 男)和 2 名模拟患者(1 男 1 女),模拟患者为专业演员,通过网络招募,每小时报酬 35 澳元,该研究获新南威尔士大学人类研究伦理委员会批准。
- 数据收集 :每次咨询,EQClinic 为每位发言者生成一个分辨率 640x480 像素、帧率 25fps 的 MP4 视频记录,使用 FFMpeg 软件提取音频记录。随机选取 12 个访谈会话,确保每种性别配对(男 - 男、男 - 女、女 - 男、女 - 女)各有 3 个视频。会话时长 12 - 18 分钟,平均 14.8 分钟,每个会话有 2 个视频,每个视频包含 668 - 1705 个单词,平均 1187 个单词,共分析 24 个视频、28480 个单词。
- 转录服务
- 服务类型 :将 24 个视频发送给 7 个转录服务,2 个手动转录服务(独立专业转录员 CB 和 Rev.com 的自由职业者 Rev),5 个 ASR 系统(Google Cloud、IBM Watson、Microsoft Azure、Trint、

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值