基于进化算法的特征子集选择在语音自动情感识别中的应用
1. 引言
人类是情感丰富的生物,社交互动依赖于表达自身情感和感知他人情绪的能力。情感计算作为一个新兴研究领域,致力于开发能够检测和响应用户情绪的设备,其主要目标是捕捉和处理情感信息,以增强人机之间的交流。
情感数据库为开发情感识别器或合成器提供了良好的机会。研究人员使用双语多模态情感数据库中的音频记录,计算了不同的语音副语言参数,用于分析人类情感语音。同时,机器学习范式在相关研究中也发挥了重要作用。
2. 相关工作
情感数据库可用于训练情感应用程序,这类数据库通常记录图像、声音、心理生理值等信息。已有许多研究关注人类情感语音分析中的不同特征,大多基于基频、能量和时间参数。也有不少工作以机器学习范式为主导。
例如,一些研究使用特征选择方法将神经网络应用于语音情感识别,但具体方法和范式有所不同。还有研究使用较少的情感类别和贪心算法来选择特征。
3. 使用机器学习范式研究自动情感识别相关参数
3.1 RekEmozio数据库
RekEmozio双语数据库旨在为用户情感研究提供信息存储,添加了录音的描述性信息,方便提取语音参数和视频特征。该数据库使用的情感基于相关研究选定,并添加了中性情感,涉及西班牙语和巴斯克语。
3.2 情感特征提取
语音情感识别中,从语音信号中提取哪些特征是关键问题。以往研究表明,很难找到能可靠指示语音中情感的特定语音特征。
本研究使用标准信号处理技术处理RekEmozio数据库中的音频记录(立体声波形文件,采样率44100 Hz),提取
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



