34、语音识别与相关技术发展解析-优快云博客

本文链接：https://blog.youkuaiyun.com/blue/article/details/152115056

语音识别与相关技术发展解析

语音识别早期基础与技术概念

在语音识别领域的发展历程中，有许多早期的研究和技术概念奠定了基础。1925 年，贝尔电话实验室由西方电气研究实验室和美国电话电报公司（AT & T）的一些工程部门合并而成，其总部最初位于曼哈顿，直到 20 世纪 40 年代迁至新泽西州郊区的多个地点，最终定址于默里山。

为了限制信号的频率，电气工程师们使用被称为“滤波器”的电子设备。其中，低通滤波器用于限制信号的最高频率，高通滤波器用于限制最低频率，而带通滤波器则同时限制最高和最低频率。正确设计滤波器是电气工程的一个专业领域。

标准电话信号的带宽通常被认为约为 4kHz，但实际上，电话信号的高频部分在 3.4kHz 以上会衰减，在 4kHz 以上会被完全过滤掉；低频部分在 400Hz 以下会衰减，在 0Hz 时会被完全过滤。因此，标准电话信号的有效净带宽为 3kHz，范围从 400Hz 到 3400Hz。

语音识别技术的发展与创新

语音识别技术在不断发展和创新。1952 年，K. H. Davis、R. Biddulph 和 S. Balashek 发表了“Automatic Recognition of Spoken Digits”，这是语音识别领域的重要研究成果。如今，许多语音识别系统通过说话人自适应来显著提高性能。例如，某些听写系统要求用户说出系统提供的一些“训练”句子；在现代语音网络搜索中，如智能手机上的谷歌移动搜索，当远程服务器接收到同一设备的新语音时，会自动进行自适应，假设是同一用户在使用已识别的手机。自适应过程使系统适应于用户的声学参数、说话风格，包括用词频率和特定的发音方式。

在信号处理方