Meta最新开源!跟踪一切升级版!性能超越OmniMotion!

Meta推出CoTracker,一个能跟踪长视频中任意多个点的模型,性能优于谷歌的OmniMotion。该模型利用Transformer网络,结合光流和点跟踪思想,支持动态添加点进行跟踪,适用于长视频序列。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作者:空港 | 来源:3D视觉工坊

在公众号「3D视觉工坊」后台,回复「原论」即可获取论文pdf。

添加微信:dddvisiona,备注:目标检测,拉你入群。文末附行业细分群。

0. 笔者个人体会

最近几个月,CV界真是跟“一切”杠上了。先是Meta在4月5日发布了Segment Anything,可以为任何图像中的任何物体提供Mask。随后又涌现出大量的二创“一切”,例如SAM3D(在3D场景中分割一切)、SAMM(分割一切医学模型)、SegGPT(分割上下文中的一切)、Grounded Segment Anything(检测一切/生成一切)等等,真的是一个大模型统治一个领域了。而在6月8日,谷歌又提出了“跟踪一切”模型OmniMotion,直接对视频中每个像素进行准确、完整的运动估计。

本以为这就完了,结果前两天Meta又新开源了CoTracker:跟踪任意长视频中的任意多个点,并且可以随时添加新的点进行跟踪!性能直接超越了谷歌的OmniMotion,不禁感叹大佬们的世界真是太卷了。今天笔者就带领小伙伴们欣赏一下这一神作!注意,这里说的跟踪一切,并不是目标跟踪,而是针对具体的点跟踪。对目标跟踪感兴趣的小伙伴可以关注Track Anything这篇文章。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

3D视觉工坊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值