语音识别技术:从实验室到现实应用
在当今科技飞速发展的时代,语音识别技术已经逐渐融入我们的生活。然而,这项技术的发展并非一帆风顺,它经历了从实验室研究到实际商业应用的漫长过程。
全球语音技术研究格局
20世纪90年代初,美国的语音技术主要在大型企业研究中心进行开发,如AT&T的贝尔实验室、IBM的T. J. 沃森研究中心和德州仪器的实验室。同时,微软和苹果也开始关注语音技术。此外,像麻省理工学院、卡内基梅隆大学等高校,以及波士顿的博尔特、贝兰克和纽曼公司和加州门洛帕克的斯坦福研究所等研究机构,在DARPA的资助下,也在进行语音识别和语音技术的研究。
欧洲也有自己的语音技术发展计划,主要由欧盟资助,参与的公司包括西门子和飞利浦,还有法国电信、意大利电信、西班牙电话公司等国家电信组织,以及几乎所有西欧国家的学术机构。在日本,日本电报电话公司(NTT)和三菱等公司的语音产业研究蓬勃发展,大阪著名且独立的高级电信研究(ATR)所吸引了世界各地的语音科学家。在中国和印度,一些重要的大学也提供语音技术研究项目。
尽管全球研究人员努力扩大词汇量、改进对不同说话者和自然语音的处理、优化声学模型训练方法,并提高在嘈杂环境中的识别鲁棒性,但语音技术的商业发展却滞后。似乎“语音理解计算机业务”难以起步,直到一些相对不起眼的应用引起了研究实验室之外世界的关注。
AT&T语音识别技术的突破
1992年3月的一个早晨,AT&T推出了一项新技术,该技术可以“在对方付费和第三方付费长途电话中对语音做出响应”,通过自动化,这家电话巨头可以裁员6000多名话务员。这项技术的主要开发者之一,贝尔实验室拉里·拉宾纳团队的杰伊·威尔彭
超级会员免费看
订阅专栏 解锁全文
846

被折叠的 条评论
为什么被折叠?



