论文阅读：Tensorize, Factorize and Regularize: Robust Visual Relationship Learning

最新推荐文章于 2021-11-16 09:00:08 发布

Kivee123

最新推荐文章于 2021-11-16 09:00:08 发布

阅读量944

点赞数 1

CC 4.0 BY-SA版权

文章标签： scene understand

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_37014750/article/details/82868991

Relational learning module（CVPR2018）

文章
本文的基础的visual relationship detection框架还是iterative message passing那套，不过想办法加入了relationship的分布先验知识
在这里插入图片描述
如果对整个数据集分析的话，假设一共有n类object，m类predicate，统计不同的sub-pre-obj，可以得到一个nxnxm的张量，这个张量可以看作m个nxn的矩阵堆叠的，每个矩阵对于一种predicate，假设第k个矩阵，其第(i,j)个元素则表示visual phrase (i-k-j)的出现次数。这个张量有一个特点就是很稀疏，而且不对称，因为有很多物体之间的某些关系在数据集出现很少甚至没有。事实上几乎只有约1%的可能关系被dataset包含了，也就是有很多数据缺失。
直接用上面这个稀疏的张量当做先验的话几没有太大用处，因为很多0，于是paper想办法先将其分解，然后重组。由于张量很稀疏，每个object都可以有r维的隐藏表示，于是可以将所有物体的表示设为A（nxr的矩阵），对于每个关系k，有一个关系因子矩阵R_k（rxr矩阵），至于为什么要这么做可以参看交替最小二乘法ALS，于是分解的模型可以写为：

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。