语音信号处理--韩纪庆--笔记1:声学基础及产生模型

语音信号的声学基础及产生模型

1.语音信号产生:说话人产生想要语言表达的信息,转换成语言编码(将信息用所包含的音素序列、韵律、响度、基音周期的升降表达出来),神经肌肉命令声带振动,并塑造声道形状。

2.语音的声学特征:声波是一种纵波(传播方向和振动方向一致)。从物理描述上看,声波参数有频率--音高;振幅--响度。物理概念以外还有复合音(有一串倍音,但并非所有倍音都那么明显)、纯音(只有基音没有倍音--类似周期信号的频谱谐波性收敛性)。当把声道看成一个发音的腔体时,激励的频率达到固有频率时,声道会以最大的振幅振荡,即产生共鸣,这个频率叫共振频率

3.语音信号的时频域表示:

①时域波形:语音信号--电信号--A/D采样存入计算机;语音信号具有短时平稳性,元音信号具有很强的准周期性,幅度较强;辅音信号波形类似于白噪声,振幅较弱

②频域波形:以频率为横轴,声音强弱为纵轴(单位dB)的图

③语谱图:横轴表示时间,纵轴表示频率,图上像素点的灰度值反应相应时刻、相应频率的信号能量。--宽带语谱图频率分辨率高,呈现垂直条纹,条纹间距即为基音周期窄带语谱图时间分辨率高,呈横杠,其为共振峰

4.汉语中的语音分类:

辅音、单元音、复元音、复鼻尾音。

5.汉语语音的韵律特性:

音色--由混入基音的倍音决定的;音高--对应频率变化,基频随声调的变化而变化;音长--发音时间的持续长短;音强--发音轻重。

汉语语音的特点:音素少、音节少、音节简单。

6.语音信号的感知:

听觉系统(略)

听觉特性:一般来说,声音从右耳传至左脑的速度比较快;对于辅音,右耳比左耳强一些,听音调也是右耳有优势

掩蔽效应:人耳的主观感觉(听觉)和客观实际(声波)不完全一致。掩蔽效应是一种心理声学现象,在一个较强的声音附近,相对较弱的声音不被人耳察觉。掩蔽分为同时掩蔽和异时掩蔽。同时掩蔽发生在掩蔽者和被掩蔽着同时存在,也叫频域掩蔽,能否被听到取决于强度和频率;异时掩蔽也叫时域掩蔽,分为前掩蔽(可持续20ms)和后掩蔽(可持续100ms)

7.语音信号的线性产生模型:

激励模型(语音和噪声)--声道模型--辐射模型(口和唇)

8.语音信号的非线性产生模型:

调频-调幅模型(AM-FM)--能量算子--能量分离算法

ps:以下摘自语音信号处理-赵力:

9.语音生成系统和语音感知系统

发音系统包括口、鼻、咽、喉、气管、肺;喉的部分称为声门,由声门到嘴唇的呼吸道为声道,声道形状不断改变,发出不同声音。

听觉系统的主要部分是人耳,由内耳中耳外耳组成,内耳的主要器官是耳蜗,它将声音通过机械变换变为神经发放信号。人儿的听觉系统有两个特性--耳蜗对于声音信号的时频分析、人耳听觉掩蔽特性。

                   

10.语音信号的数学模型

①激励模型--发浊音时声带不断开关,产生间歇性脉冲波,形状类似于斜三角波如下,即浊音为以基音周期为周期的斜三角波脉冲串;发清音时可用随机白噪声模拟。

                                        

②声道模型--两种常见建模方法:视为多个等长的不同截面的管子串联起来的系统(声管模型),或者视为一个谐振腔(共振峰模型)。基于物理学的共振峰理论可分为级联、并联、混合型共振峰模型。

③辐射模型--语音信号的声压波和从声道模型输出的速度波之比称为辐射阻抗,表征口唇的辐射效应。

综上,完整的语音信号模型可以用激励模型、声道模型、辐射模型串联表示:

      

### 关于《语音信号处理韩纪庆(第三版) 目前无法直接提供或确认《语音信号处理韩纪庆(第三版)PDF的具体下载地址,因为这可能涉及版权保护问题。然而,可以通过正规渠道获取该书籍的内容,例如访问图书馆、购买正版图书或通过学术资源平台查找相关内容。 如果希望了解此书的核心内容,可以从以下几个方面入手: #### 1. **书籍概述** 《语音信号处理》由韩纪庆编写,是一本经典的教材,广泛应用于语音信号处理的教学和研究领域。书中涵盖了语音信号处理基础理论和技术实现方法[^1]。具体来说,本书分为三个部分: - 基础知识:介绍语音信号的基本特性及其处理原理。 - 技术分析:深入探讨时域分析、频域分析以及各种建模技术。 - 应用实践:讲解如何将这些技术应用于实际场景,如语音识别、说话人识别等。 #### 2. **替代学习资源** 对于初学者而言,《语音信号处理》虽然经典,但也存在一定的难度。以下是其他可供参考的学习材料: - 《Kaldi语音识别实战》,陈果果等人著(2020),提供了丰富的实例和代码支持,适合希望通过编程加深理解的读者[^2]。 - Speech Technology: Spectrogram, Cepstrum and Mel-Frequency Analysis (PDF),介绍了语音信号处理中的关键技术概念,如语谱图、倒谱分析和梅尔频率分析[^3]。 #### 3. **在线资源建议** 为了合法合规地获取相关资料,可以尝试以下途径: - 访问各大高校图书馆网站,许多学校会提供电子版本的教材供学生查阅。 - 使用Google Scholar或其他学术搜索引擎输入关键词“语音信号处理 韩纪庆”,可能会找到一些公开章节或摘要。 - 如果有特定需求,也可以联系作者团队或出版社询问是否有官方授权的数字化版本。 ```python import requests def search_book(title, author): url = f"https://api.example.com/books?title={title}&author={author}" response = requests.get(url) if response.status_code == 200: data = response.json() return data['results'] else: return None book_results = search_book("语音信号处理", "韩纪庆") if book_results: print(book_results) else: print("未找到相关书籍信息") ``` 上述脚本仅为示例用途,展示如何利用API接口查询书籍元数据。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值