Structure Guided Multi-modal Pre-trained Transformer forKnowledge Graph Reasoning

摘要

多模态知识图(Multimodal knowledge graphs, MKGs)可以直观地以不同的方式组织信息,有利于多种实际的下游任务,如推荐系统和视觉问题回答。然而,大多数MKG推理模型还远未完成,这促使了MKG推理模型的蓬勃发展。近年来,随着通用人工体系结构的发展,预训练变压器模型越来越受到人们的关注,特别是在多模态场景下。然而,针对知识图推理(KGR)的多模态预训练变压器(MPT)的研究还处于起步阶段。MKG数据与其他多模态数据的最大区别在于,MKG数据所蕴含的丰富的结构信息在现有的MPT模型中仍然不能被充分利用。它们大多只是利用图结构作为检索图来匹配与同一实体相连的图像和文本。这种方式阻碍了他们的推理表现。为此,我们提出了用于知识图推理的图结构引导多模态预训练变压器,称为SGMPT。具体来说,采用图结构编码器对结构特征进行编码。然后,设计了一种以结构为导向的融合模块,采用加权求和和对齐约束两种策略,将结构信息同时注入到文本特征和视觉特征中;据我们所知,SGMPT是第一个用于多模态KGR的MPT模型,它挖掘了知识图底层的结构信息。在FB15k-237-IMG和WN18-IMG上的大量实验表明,我们的SGMPT优于现有的最先进模型,并证明了所设计策略的有效性。

1.介

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小蜗子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值