直播预告 | CVPR’22:基于多面注意力机制的人群计数

本次直播邀请到西安交通大学硕士生林卉,解析其在CVPR 2022发表的研究——通过多面注意力机制解决人群计数中的尺度差异和标签噪声问题。论文提出区域注意力机制、局部注意力正则化和实例注意力损失等创新方法,将深入探讨这些技术的原理、实现与实验效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

​「AI Drive」是由 biendata 和 PaperWeekly 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。

本期 AI Drive,我们邀请到西安交通大学网络空间安全学院一年级硕士生-林卉,为大家在线解读其发表在CVPR 2022的最新研究成果:基于多面注意力机制的人群计数。对本期主题感兴趣的小伙伴,5月 24日(周二)晚 7 点,我们准时相约 AI_Drive  B 站直播间。

一、直播信息

1、演讲摘要:

本次讲座将主要汇报我们CVPR 2022 的一篇文章。该文主要针对人群计数任务的两个难点:首先,密集人群图像中由于远近关系人头大小差异很大;其次,部分提供的标签由于标注误差等原因不在人头正中心位置,因此存在噪声。为此,本文提出了三个模块:

1)Transformer 中可学习的区域注意力机制,实现动态地为每个特征分配注意力;

2)与其配套的局部注意力正则化,通过最小化不同特征位置的注意力偏差来监督变形器网络的训练,解决尺度差异问题;

3)实例注意力损失,可在训练期间动态地关注最重要的实例,减弱标签噪声带来的负面影响。

2、论文名称:

Boosting Crowd Counting via Multifaceted Attention

3、论文链接:

https://arxiv.org/pdf/2203.02636.pdf

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值