34、语音识别与相关技术发展解析

语音识别技术发展历程解析

语音识别与相关技术发展解析

语音识别早期基础与技术概念

在语音识别领域的发展历程中,有许多早期的研究和技术概念奠定了基础。1925 年,贝尔电话实验室由西方电气研究实验室和美国电话电报公司(AT & T)的一些工程部门合并而成,其总部最初位于曼哈顿,直到 20 世纪 40 年代迁至新泽西州郊区的多个地点,最终定址于默里山。

为了限制信号的频率,电气工程师们使用被称为“滤波器”的电子设备。其中,低通滤波器用于限制信号的最高频率,高通滤波器用于限制最低频率,而带通滤波器则同时限制最高和最低频率。正确设计滤波器是电气工程的一个专业领域。

标准电话信号的带宽通常被认为约为 4kHz,但实际上,电话信号的高频部分在 3.4kHz 以上会衰减,在 4kHz 以上会被完全过滤掉;低频部分在 400Hz 以下会衰减,在 0Hz 时会被完全过滤。因此,标准电话信号的有效净带宽为 3kHz,范围从 400Hz 到 3400Hz。

语音识别技术的发展与创新

语音识别技术在不断发展和创新。1952 年,K. H. Davis、R. Biddulph 和 S. Balashek 发表了“Automatic Recognition of Spoken Digits”,这是语音识别领域的重要研究成果。如今,许多语音识别系统通过说话人自适应来显著提高性能。例如,某些听写系统要求用户说出系统提供的一些“训练”句子;在现代语音网络搜索中,如智能手机上的谷歌移动搜索,当远程服务器接收到同一设备的新语音时,会自动进行自适应,假设是同一用户在使用已识别的手机。自适应过程使系统适应于用户的声学参数、说话风格,包括用词频率和特定的发音方式。

在信号处理方

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值