情感语音时长建模与图像检索技术研究
在当今科技飞速发展的时代,情感语音和图像检索领域的研究变得愈发重要。情感语音的分析有助于让计算机和机器人更具人性,而图像检索技术则能帮助我们更高效地管理和查找海量的图像数据。本文将深入探讨情感语音时长建模和基于颜色与形状特征的图像检索这两项技术。
情感语音时长建模
情感分析
在人类交流中,情感是一种重要的交流方式。研究选取了七种具有代表性的情感进行分析:
1. 中性 :人们无情感交流时的状态。
2. 恐惧 :面对可怕事物时表达的情感,类似于害怕。
3. 愤怒 :通常被视为负面情绪,但从某些心理学家的角度看,它也能赋予个体防御的活力,可被视为正面情绪。
4. 得意 :与幸福、喜悦类似,具有自信和带来感官满足的特点。
5. 悲伤 :也称为悲哀,通常在面对令人情绪低落的事情时表达,虽是负面情绪,但也有积极作用。
6. 惊讶 :可能是正面或负面的。
7. 厌恶 :一种负面情绪,是面对某些事物或个人偏见时产生的身体或精神上的排斥。
语料库介绍
语料库选取了音素平衡的句子作为录制材料,共有 168 个句子,包含 1616 个音节,句子长度在 7 到 10 个音节之间,平均长度为 9.6 个音节。由一位 12 岁的母语为普通话的小学生录制,每个句子以七种情感进行表达,共得到 117
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



