动作识别——Multi-Model Domain Adaptation for Fine-Grained Action Recognition——CVPR2020 oral

最新推荐文章于 2024-03-06 14:00:22 发布

原创最新推荐文章于 2024-03-06 14:00:22 发布 · 1.6k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

博士科研同时被 3 个专栏收录

28 篇文章

订阅专栏

计算机视觉

17 篇文章

订阅专栏

5 篇文章

订阅专栏

本文探讨了细粒度动作识别领域的挑战，特别是环境偏见问题，提出了利用多模态自监督和模态对抗训练的解决方案。通过引入一种新的数据集，文章强调了未来工作在音频模态上的潜在研究方向。

部署运行你感兴趣的模型镜像

作者信息

Abstract

Fine-grained action recognition datasets exhibit environmental bias, where multiple video sequences are captured from a limited number of environments. Multi-modal nature of video（视频的多模态性），提出的方法一个是multi-modal self-supervision，还有一个是adversarial training per modality

Introduction

fine-grained action recognition,
举的例子
不同数据集的比较
Few works have attempted deep UDA for video data《Temporal attentive alignment for large-scale video domain adaptation, ICCV2019》《Deep domain adaptation in action space, BMVC2018》

Conclusion

modality指的是两种信息（optical flow和RGB信息）,future work包含audio

Key points: Motivation很好; 提出的新数据集

您可能感兴趣的与本文相关的镜像

Qwen3-VL-30B

Qwen3-VL-30B

图文对话

Qwen3-VL

Qwen3-VL是迄今为止 Qwen 系列中最强大的视觉-语言模型，这一代在各个方面都进行了全面升级：更优秀的文本理解和生成、更深入的视觉感知和推理、扩展的上下文长度、增强的空间和视频动态理解能力，以及更强的代理交互能力

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。