AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。
CVPR 2021 论文推荐
On Semantic Similarity in Video Retrieval(论视频检索中的语义相似性)
论文链接:https://www.aminer.cn/pub/60547c4a91e0116f82f2d65d/?conf=cvpr2021
推荐理由: 语义图像合成任务将语义布局转化为照片现实图像,是一对多映射问题。尽管近期取得了令人印象深刻的进展,但有效产生语义级多模态结果的多样化语义合成仍然是一个挑战。在本文中,作者从语义类分布的角度出发,提出了一种新型的多样化语义图像合成框架,支持语义甚至实例级别的多样化生成。该工作将类级条件调制参数建模为连续的概率分布而非离散值,并通过实例自适应的随机采样对每个实例的调制参数进行采样,使其在整个网络中保持一致。在多个数据集上的广泛实验表明,与最先进的方法相比,上述方法可以实现优秀的多样性及质量。





Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking(变形器遇上追踪器:利用时间上下文进行稳健的视觉追踪)
论文链接:https://www.aminer.cn/pub/6059cb9691e011ed950a5c21/?conf=cvpr2021
推荐理由: 在视频对象跟踪中,连续帧之间存在着丰富的时间上下文信息,这被现有的跟踪器所忽视。在这项工作中,作者将各个视频帧进行桥接,并通过变换器架构探索它们之间的时间上下文,以实现稳健的对象跟踪。与自然语言处理任务中变压器的经典用法不同,作者将其编码器和解码器分离成两个平行的分支,并在跟踪管道中精心设计。其中变换器编码器通过基于注意力的特征强化来促进目标模板,利于高质量的跟踪模型生成;变换器解码器将从前模板中的跟踪线索传播到当前帧中,有利于对象搜索过程。通过将上述变换器与最近的判别式跟踪管道相结合,该方法在普遍的跟踪基准上创造了几个新的最先进的记录。





Affect2MM: Affective Analysis of Multimedia Content Using Emotion Causality(Affect2MM:利用情感因果关系对多媒体内容进行情感分析)
论文链接:https://www.aminer.cn/pub/604b3c9791e0110eed64c392/?conf=cvpr2021
推荐理由: 作者提出了Affect2MM,一种针对多媒体内容的时间序列情感预测的学习方法。该工作的目标是自动捕捉现实生活中以人为中心的情景和行为中人物的不同情绪,利用情感因果理论的思想,对电影片段中的诱发情感状态进行计算建模和判断。Affect2MM利用基于注意力的方法和格兰杰因果关系对时间因果关系进行建模,使用多种成分,如参与的演员的面部特征、场景理解、视觉美学、动作/场景描述和电影剧本等来获得一个富含情感的表征来理解和感知场景。同时,作者使用基于LSTM的学习模型进行情感感知。为了评估上述方法,作者在SENDv1、MovieGraphs和LIRIS-ACCEDE数据集三个数据集上进行分析和比较,观察到该方法在三个数据集的性能比SOTA方法平均提高了10-15%。




AMiner,一个具有认知智能的学术搜索引擎:https://www.aminer.cn/
#AMiner# #论文#

AMiner平台是清华大学研发的学术搜索引擎,提供科技情报服务。本文推荐了三篇CVPR2021的论文,分别涉及语义图像合成的多样化生成、利用时间上下文的视觉追踪和多媒体内容的情感分析。这些工作在各自的领域展现了创新技术,如使用变换器架构增强跟踪模型,以及利用情感因果关系进行情感预测。
2万+

被折叠的 条评论
为什么被折叠?



