语音技术:从听写软件到交互系统的变革
1. 语音听写软件的广泛应用
语音听写软件在多个专业领域成为日常工作工具。律师和医生尤其青睐定制版软件,而放射科医生借助该软件减少了对转录打字员的需求,从而降低了劳动成本。对于转录员而言,软件也价值巨大,能让他们在更短时间内完成更多转录工作。
例如,Dictaphone的医疗转录服务在20世纪90年代中期,在语音听写系统广泛应用前,依靠大量人力进行“碳基转录”,收入达数亿美元。转向“硅基转录”后,用更少的员工就能完成更多转录工作。语音听写系统可对录音带进行首次识别,批量处理并生成初稿,人类转录员只需纠正错误就能得到终稿。如今,仍有转录公司采用这种半手动流程来缩短周转时间、提高利润率。
随着智能手机成为主要甚至唯一的通讯工具,其键盘和触摸屏越来越小,而手指大小不变,输入长信息变得困难。因此,当口袋智能设备的小键盘和触摸屏成为常态时,语音听写可能会成为输入任何长度和复杂度信息的唯一可靠有效方式。
2. 语音用户界面(VUI)的诞生:Wildfire的创新
20世纪90年代初,语音识别研究界的目标是在更复杂任务中实现更高的识别准确率,以构建接近人类语音和语言能力的机器,普遍认为要构建人机对话系统,需让机器自动识别和理解自然语言。但AT&T的语音识别呼叫处理系统表明,将识别任务限制在五个关键词,就能为公司和客户带来实际效益。
企业家Bill Warner的Wildfire公司让“语音用户界面”(VUI)概念引起关注。20世纪80年代末,Warner曾探索计算机视频通信系统,但时机不成熟,后转向电话通信。1991年,他与Nick d’Arbeloff、Rich Miner和Tony
超级会员免费看
订阅专栏 解锁全文
985

被折叠的 条评论
为什么被折叠?



