Multi-Interactive Memory Network for Aspect BasedMultimodal Sentiment Analysis（AAAI-2019）

最新推荐文章于 2022-11-05 19:17:22 发布

C_andylist

最新推荐文章于 2022-11-05 19:17:22 发布

阅读量5.3k

点赞数

CC 4.0 BY-SA版权

文章标签：深度学习人工智能自然语言处理图像处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/C_andylist/article/details/123440121

本文探讨了多模态情感分析的新进展，提出一种多交互记忆网络，专门针对方面层面的情感理解，捕捉文本、图像数据的多重相关性，填补了现有研究的空白。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

随着多模态用户生成内容（如文本和图像）在互联网上的流行，多模态情感分析近年来受到了越来越多的研究关注。在方面层面的情感分析中，多模态数据通常比纯文本数据更重要，并且具有各种相关性，包括该方面对文本和图像带来的影响，以及与文本和图像相关的交互作用。然而，到目前为止，在方面层面和多模态情感分析的交叉点上还没有进行任何相关的工作，因此本文提出了方面级情感分析任务。

本文贡献：

（1）填补了方面级情感分析和多模态情感分析之间的空白。

（2）提出了一种多交互记忆网络来捕获多模态数据中的多重相关性。

模型：

本文的整体流程图如下所示，值得注意的是模型共有3-hop，1-hop与2-hop和3-hop的输入不同。

最左边代表文本的embediing，中间为方面项embedding，右面为图像的embedding。

文本的embedding：

方面项的embedding：

特别的是本文为了消除多词影响？直接用了所有方面项单词的平均值：

图像的embedding：

然后本文分别将方面项与文本和图像结合，我们仅给出与图像集合的公式，文本与其相似：

但本文的描述与模型图略有偏差，在第一层的没有GRU的计算，但在模型图中有，

然后是2-hop和3-hop的公式如下：

文本与图像的embedding中都包含有方面项信息，然后图-图，图-文，文-文，文-图按这个顺序来结合隐藏状态，之后将他们通过GRU连接起来：

最后经过softmax来判断情感极性

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。