5、语音识别的深度学习突破之旅

语音识别的深度学习突破之旅

1. 相遇与理念碰撞

2008 年 12 月 11 日,李邓来到不列颠哥伦比亚省惠斯勒的一家酒店,他不是来滑雪的,而是参加人工智能会议相关活动。多年来,他致力于开发语音识别软件,先是在加拿大滑铁卢大学任教,后在微软西雅图附近的中央研发实验室担任研究员。然而,当时的语音识别技术进步缓慢,微软的语音系统准确率提升也很有限。

在惠斯勒的一次活动中,李邓遇到了杰夫·辛顿。早在上世纪 90 年代初,辛顿曾参与李邓学生的论文指导,但此后因连接主义研究失宠,两人交集甚少。此次相遇,辛顿向李邓介绍了“深度学习”,称神经网络开始在语音识别中发挥作用。李邓起初并不相信,他认为辛顿并非语音研究专家,且神经网络此前从未在实际应用中取得显著成效。但辛顿坚持让李邓尝试,还表示他们的深度信念网络能从更多数据中学习,性能已接近领先的语音识别方法。李邓虽答应尝试并交换了邮箱,但之后几个月并未行动。

2. 研究进展与疑虑

夏天,李邓有了些空闲时间,开始阅读关于神经语音识别的文献。他对其性能印象深刻,便联系辛顿提议围绕此理念组织新的惠斯勒研讨会,但仍质疑该技术的长期前景,因为它被全球语音研究界忽视。随着下一次惠斯勒活动临近,辛顿给李邓发邮件附上研究论文初稿,显示神经网络分析约三小时语音后能达到顶尖语音方法的性能。李邓依旧不信,认为多伦多研究人员对技术的描述难以理解,且测试是在实验室环境下进行。直到他看到原始测试数据,才开始相信。

3. 微软合作与原型构建

当年夏天,李邓邀请辛顿到华盛顿州雷德蒙德的微软研究实验室。辛顿因背部问题,历经艰难旅程才到达。他先乘地铁到多伦多市中心的汽车站,坐长途巴士到水牛城,再安排好签证后乘近三天

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值