43、儿童自动说话人验证系统的数据增强与特征拼接技术

儿童说话人验证数据增强与特征拼接

儿童自动说话人验证系统的数据增强与特征拼接技术

1 引言

在儿童自动说话人验证(ASV)系统的开发中,数据稀缺是一个关键问题,这会导致系统性能不佳。为了解决这个问题,我们提出了一种跨领域数据增强技术,并结合特征拼接方法,旨在提高儿童 ASV 系统的性能。

2 跨领域数据增强

由于儿童语音数据有限,使用少量儿童语音训练基于 x 向量的 ASV 系统会导致性能不理想。因此,我们利用现有的成人语音语料库合成具有儿童语音声学属性的语音数据,并将其与儿童语音一起用于训练模型参数。具体方法如下:
1. 语音转换(VC) :使用循环一致生成对抗网络(CGAN)对成人语音进行转换。用每个说话人群体(成人和儿童)约 10 分钟的语音数据训练 CGAN,转换后的成人语音在听觉测试中听起来与儿童语音非常相似,大大减少了声学不匹配问题。
2. 音高缩放(PM) :将成人语音的音高提高 1.35 倍,以补偿成人和儿童语音音高的差异,采用相关文献中报道的音高修改技术。
3. 时间尺度修改(TSM) :将成人语音的说话速率降低 1.4 倍,因为儿童的说话速率比成人慢。
4. 共振峰修改(FM) :将成人语音的共振峰频率提高 0.08 倍,考虑到儿童的共振峰频率比成人高。

最后,将所有修改后的成人语音数据与儿童语音数据和未修改的成人语音数据合并,通过默认的三向速度扰动 Kaldi 管道进一步增加训练数据量。

以下是数据增强的流程:


                
内容概要:本文档围绕直流微电网系统展开,重点介绍了包含本地松弛母线、光伏系统、锂电池储能和直流负载的Simulink仿真模型。其中,光伏系统采用标准光伏模型结合升压变换器实现最大功率点跟踪,电池系统则基于锂离子电池模型双有源桥变换器进行充放电控制。文档还涉及在dq坐标系中设计直流母线电压控制器以稳定系统电压,并实现功率协调控制。此外,系统考虑了不确定性因素,具备完整的微电网能量管理和保护机制,适用于研究含可再生能源的直流微电网动态响应稳定性分析。; 适合群:电气工程、自动化、新能源等相关专业的研究生、科研员及从事微电网系统仿真的工程技术员;具备一定的MATLAB/Simulink使用【直流微电网保护】【本地松弛母线、光伏系统、电池和直流负载】【光伏系统使用标准的光伏模型+升压变换器】【电池使用标准的锂离子电池模型+双有源桥变换器】Simulink仿真实现基础和电力电子知识背景者更佳; 使用场景及目标:①构建含光伏储能的直流微电网仿真平台;②研究微电网中能量管理策略、电压稳定控制保护机制;③验证在不确定条件下系统的鲁棒性动态性能;④为实际微电网项目提供理论支持仿真依据; 阅读建议:建议结合文中提到的Simulink模型MATLAB代码进行实操演练,重点关注控制器设计、坐标变换系统集成部分,同时可参考提供的网盘资源补充学习材料,深入理解建模思路参数整定方法。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值