Meta最新开源！跟踪一切升级版！性能超越OmniMotion！

3Ｄ视觉工坊

已于 2023-08-12 10:45:21 修改

阅读量450

点赞数

CC 4.0 BY-SA版权

分类专栏： 3D视觉从入门到精通文章标签：大模型

于 2023-07-20 07:01:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Yong_Qi2015/article/details/131842854

3D视觉从入门到精通专栏收录该内容

634 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

Meta推出CoTracker，一个能跟踪长视频中任意多个点的模型，性能优于谷歌的OmniMotion。该模型利用Transformer网络，结合光流和点跟踪思想，支持动态添加点进行跟踪，适用于长视频序列。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作者：空港 | 来源：3D视觉工坊

在公众号「3D视觉工坊」后台，回复「原论文」即可获取论文pdf。

添加微信：dddvisiona，备注：目标检测，拉你入群。文末附行业细分群。

0. 笔者个人体会

最近几个月，CV界真是跟“一切”杠上了。先是Meta在4月5日发布了Segment Anything，可以为任何图像中的任何物体提供Mask。随后又涌现出大量的二创“一切”，例如SAM3D（在3D场景中分割一切）、SAMM（分割一切医学模型）、SegGPT（分割上下文中的一切）、Grounded Segment Anything（检测一切/生成一切）等等，真的是一个大模型统治一个领域了。而在6月8日，谷歌又提出了“跟踪一切”模型OmniMotion，直接对视频中每个像素进行准确、完整的运动估计。

本以为这就完了，结果前两天Meta又新开源了CoTracker：跟踪任意长视频中的任意多个点，并且可以随时添加新的点进行跟踪！性能直接超越了谷歌的OmniMotion，不禁感叹大佬们的世界真是太卷了。今天笔者就带领小伙伴们欣赏一下这一神作！注意，这里说的跟踪一切，并不是目标跟踪，而是针对具体的点跟踪。对目标跟踪感兴趣的小伙伴可以关注Track Anything这篇文章。

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

3Ｄ视觉工坊 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。