语音识别与相关技术发展解析
语音识别早期基础与技术概念
在语音识别领域的发展历程中,有许多早期的研究和技术概念奠定了基础。1925 年,贝尔电话实验室由西方电气研究实验室和美国电话电报公司(AT & T)的一些工程部门合并而成,其总部最初位于曼哈顿,直到 20 世纪 40 年代迁至新泽西州郊区的多个地点,最终定址于默里山。
为了限制信号的频率,电气工程师们使用被称为“滤波器”的电子设备。其中,低通滤波器用于限制信号的最高频率,高通滤波器用于限制最低频率,而带通滤波器则同时限制最高和最低频率。正确设计滤波器是电气工程的一个专业领域。
标准电话信号的带宽通常被认为约为 4kHz,但实际上,电话信号的高频部分在 3.4kHz 以上会衰减,在 4kHz 以上会被完全过滤掉;低频部分在 400Hz 以下会衰减,在 0Hz 时会被完全过滤。因此,标准电话信号的有效净带宽为 3kHz,范围从 400Hz 到 3400Hz。
语音识别技术的发展与创新
语音识别技术在不断发展和创新。1952 年,K. H. Davis、R. Biddulph 和 S. Balashek 发表了“Automatic Recognition of Spoken Digits”,这是语音识别领域的重要研究成果。如今,许多语音识别系统通过说话人自适应来显著提高性能。例如,某些听写系统要求用户说出系统提供的一些“训练”句子;在现代语音网络搜索中,如智能手机上的谷歌移动搜索,当远程服务器接收到同一设备的新语音时,会自动进行自适应,假设是同一用户在使用已识别的手机。自适应过程使系统适应于用户的声学参数、说话风格,包括用词频率和特定的发音方式。
在信号处理方
语音识别技术发展历程解析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



