6、语音信号分析中的关键技术研究

语音信号分析中的关键技术研究

在语音信号处理领域,语音源特征的转换以及多基频估计是两个重要的研究方向。前者在富有表现力的语音合成和语音质量控制方面具有重要意义,后者则在语音信号分析的诸多应用中发挥着关键作用。下面将详细介绍这两个方面的相关研究。

平稳歌唱语音的声门源模型选择

研究背景与目标

语音源特征的转换是富有表现力的语音合成和语音质量控制中的重要挑战。实现这一转换的关键在于对语音激励(源)特征的建模,但源和滤波器贡献的稳健分解因存在非线性相互作用而面临挑战,限制了逆滤波过程的稳健性。

研究旨在对平稳歌唱语音样本进行语音激励建模,为未来的语音质量修改做准备。通过选择近似模型来简化声门源特征的建模过程,研究聚焦于基于Rd参数选择Liljencrants - Fant(LF)模型,并提出了基于准确频谱包络信息的“归一化低频带包络”(NLBE)选择策略。

Rd参数与语音质量建模

Rd参数可量化LF模型参数(Ra、Rk、Rg)的特征趋势,从紧密内收的发声(Rd ≈ 0.3)到非常气声外展的发声(Rd ≥ 2.7)。在这个范围内,可区分出三种主要的语音质量:紧压音、模态音(正常音)和气声音。对于平稳歌唱,尤其是模态音演唱,Rd估计值应接近模态值,且随时间变化缓慢且范围窄。

NLBE声门源模型选择方法

基于Rd的语音质量建模

Rd参数能够量化LF模型参数的特征趋势,涵盖从紧压发声到气声发声的范围。在这个范围内,存在三种主要的语音质量:紧压音、模态音和气声音。研究聚焦于模态音演唱的平稳歌唱,预期Rd估计值接近模态值且变化缓慢。

基于归一
根据原作 https://pan.quark.cn/s/0ed355622f0f 的源码改编 野火IM解决方案 野火IM是专业级即时通讯和实时音视频整体解决方案,由北京野火无限网络科技有限公司维护和支持。 主要特性有:私有部署安全可靠,性能强大,功能齐全,全平台支持,开源率高,部署运维简单,二次开发友好,方便与第三方系统对接或者嵌入现有系统中。 详细情况请参考在线文档。 主要包括一下项目: 野火IM Vue Electron Demo,演示如何将野火IM的能力集成到Vue Electron项目。 前置说明 本项目所使用的是需要付费的,价格请参考费用详情 支持试用,具体请看试用说明 本项目默认只能连接到官方服务,购买或申请试用之后,替换,即可连到自行部署的服务 分支说明 :基于开发,是未来的开发重心 :基于开发,进入维护模式,不再开发新功能,鉴于已经终止支持且不再维护,建议客户升级到版本 环境依赖 mac系统 最新版本的Xcode nodejs v18.19.0 npm v10.2.3 python 2.7.x git npm install -g node-gyp@8.3.0 windows系统 nodejs v18.19.0 python 2.7.x git npm 6.14.15 npm install --global --vs2019 --production windows-build-tools 本步安装windows开发环境的安装内容较,如果网络情况不好可能需要等较长时间,选择早上网络较好时安装是个好的选择 或参考手动安装 windows-build-tools进行安装 npm install -g node-gyp@8.3.0 linux系统 nodej...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值