CVPR2017oral注意力模型RA-CNN简析(转)

本文探讨了注意力模型在机器视觉领域的应用,特别关注了RA-CNN和MA-CNN两种模型。通过对比单点与多点注意力机制,揭示了多点注意力更符合真实场景需求,同时也提出了计算量大与收敛慢的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

mark一下,翻了好久的资料!
http://www.tuan18.org/thread-2121-1-1.html

最近在关注注意力模型,为啥呢,我觉得这个跟人眼机理比较接近。同时,这个相当于让机器不再呆板,有了变化。问渠那得清如许,为有源头活水来。活的才是好玩的。
这篇文章的论文地址在这里:
http://openaccess.thecvf.com/content_cvpr_2017/papers/Fu_Look_Closer_to_CVPR_2017_paper.pdf
他有一个姊妹篇。文章地址在这里:
http://openaccess.thecvf.com/content_ICCV_2017/papers/Zheng_Learning_Multi-Attention_Convolutional_ICCV_2017_paper.pdf
两篇文章都是微软一个组发的。
代码地址在一起,用windows写的。
http://onedrive.live.com/?authkey=%21AJ9U-37Dx75rFzk&id=693885F2E24EFF4D%21125&cid=693885F2E24EFF4D
RA-CNN是学循环注意力,关注一个点,姊妹篇MA-CNN呢,是关注多个点。相较而言,一个图片多个注意力点才比较适合真实场景。两篇文章可以合二为一搞,就更接近真实的业务需求了。不过那样的话计算量大,收敛慢,但这不正是出paper的切入点么。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值