论文阅读:LinkNet:Relational Embedding for Scene Graph(NIPS18)

博客介绍了一篇论文的思想,主要包括目标检测,得到边界框和物体类别分布;利用Global Context进行物体嵌入;通过RelationEmbeddingModule进行物体分类和谓语分类。忽略了与信息技术无关的碎碎念内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文思想挺简单的。懒得放公式了 简单描述一下吧。
在这里插入图片描述
1.目标检测
得到bbox和物体类别dist

2.右上角的Global Context
这个Global得比较粗糙。
Global在使用了AvgPool的特征。
然后obj dist feature、visual feature、context feature一起进行obj embedding

3.RelationEmbeddingModule:obj classification
得到refine后的物体类别

4.RelationEmbeddingModule:pred classification
上一步obj embedding的中间特征和物体类别,准备进行predicate embedding
计算出来的特征,前一半当做主语特征,后一半当做宾语特征,再融合进union_box的特征以及主客体的坐标特征,进行谓语分类
这里的所有可能的三元组个数是N*N-N(N为物体数量)

------------------------------一些碎碎念------------------------------
过年好!!!
今年的春晚有沈腾555 我又可以了
这个语言类的阵容我!可!以!
大年初一去看四海 就是冲着我腾哥去的嘻嘻嘻

--------------2022.02.05----------------
四海我已经骂累了
春晚历年最烂
毁灭吧。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值