- 博客(11)
- 收藏
- 关注
原创 情感识别系统FV2ES论文梳理
在最新的社交网络中,越来越多的人更喜欢通过文本、语音和丰富的面部表情来表达视频中的情绪。多模态视频情感分析技术可以帮助根据图像中的人类表达和手势、声音中的音调和识别自然语言自动理解用户的内部世界。然而,在现有的研究中,与视觉和文本模态相比,声学模态长期以来一直处于边缘位置。也就是说,提高声学模态对整个多模态情感识别任务的贡献往往更加困难。此外,虽然通过引入常见的深度学习方法可以获得更好的性能,但这些训练模型的复杂结构总是导致推理效率低,尤其体现在处理高分辨率的视频和长视频时。
2023-07-25 17:30:11
566
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人