基于进化算法的特征子集选择在语音自动情感识别中的应用
1. 引言
人类是情感丰富的生物,社会互动依赖于情感的表达与感知。情感计算作为一个新兴研究领域,旨在开发能够检测和响应用户情感的设备,其主要目标是捕捉和处理情感信息,以增强人机之间的交流。开发情感应用需要分析多模态数据源,而情感数据库为训练情感识别器或合成器提供了良好的机会。本文使用双语多模态情感数据库中的音频记录,计算了不同的语音副语言参数,以分析人类情感语音。
2. 相关工作
情感数据库为训练情感应用提供了机会,这类数据库通常记录图像、声音、心理生理值等信息。许多研究聚焦于人类情感语音分析的不同特征,主要基于基频、能量和时间参数。同时,机器学习范式在相关研究中也占据重要地位。部分研究使用特征选择方法将神经网络应用于语音情感识别,但方法和范式有所不同。还有研究使用较少的情感类别和贪心方法进行特征选择。
3. 使用机器学习范式研究自动情感识别相关参数
3.1 RekEmozio 数据库
RekEmozio 双语数据库旨在为用户情感研究提供信息存储库,添加了录音的描述性信息,方便提取语音和视频特征。该数据库使用的情感基于相关研究选取,并添加了中性情感,涵盖西班牙语和巴斯克语。
3.2 情感特征提取
对于语音情感识别,关键问题是从语音信号中提取哪些特征。以往研究表明,难以找到能可靠指示语音中情感的特定语音特征。本文使用标准信号处理技术处理 RekEmozio 数据库中的音频记录,提取了 32 个特征,具体如下:
- 基频(F0):使用 Sun 算法估计,计算最大值、最小值、均值、范围、方差、标准差和 F0
超级会员免费看
订阅专栏 解锁全文
28

被折叠的 条评论
为什么被折叠?



