77、视频实例分割技术:MS - STS VIS与RankSeg的创新与突破

视频实例分割技术:MS - STS VIS与RankSeg的创新与突破

1. MS - STS VIS框架概述

MS - STS VIS是一种基于Transformer的视频实例分割(VIS)框架,旨在有效捕捉视频中跨帧多尺度的时空特征关系。该框架引入了新颖的多尺度时空分割注意力(MS - STS)模块,以及在训练过程中使用辅助判别器来增强前景 - 背景的可分离性,从而应对现实世界中目标外观变形的挑战。

1.1 对抗损失与编码器作用

在MS - STS VIS中,判别器D接收真实输入和虚假输入。对抗损失的计算公式如下:
[
\min_{Enc} \max_{D} E[\log D(F_{gt})] + E[\log(1 - D(F_{pr}))] + \lambda_1 E[||D(F_{gt}) - D(F_{pr})||_1]
]
这里,编码器Enc被视为生成器。通过这种对抗训练,编码器能够更好地划分前景和背景区域,进而提高视频实例掩码预测的准确性。需要注意的是,判别器网络仅在训练期间使用。

1.2 实验设置

1.2.1 数据集
  • YouTube - VIS 2019 :包含2883个高质量视频,有131K个标注的对象实例,分为40个不同类别。
  • YouTube - VIS 2021 :包含3859个高质量视频,有232K个标注的对象实例,同样分为40个改进后的类别。该数据集通过合并鹰和猫头鹰为鸟类、猿为猴子,删除手部类别,并添加飞盘、松鼠和鲸鱼类别,保持了
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值