TransMatting:用于图像抠图的创新方法
1. 引言
在图像抠图领域,现有的方法在处理具有透明或不显著前景对象的图像时存在一定的局限性。大多数公开数据集主要关注显著且不透明的前景,如动物和人像,而对于透明对象的研究相对较少。为了解决这些问题,本文提出了一种名为 TransMatting 的新方法,旨在提高对透明和不显著前景对象的抠图性能。
2. 主要贡献
本文的主要贡献可以总结如下:
1. Tri-token Guided Transformer Block (TGTB) 模块 :引入 Vision Transformer 模块,以大感受野提取全局语义特征。同时,将 trimap 重新设计为 tri-token map,直接将位置信息引入自注意力机制。
2. Multi-scale Global-Guided Fusion (MGF) 模块 :提出 MGF 模块以集成多尺度特征,并利用全局信息引导低级别 Transformer 特征的融合。
3. 高分辨率抠图数据集 :构建了一个包含 460 张透明或不显著前景图像的高分辨率抠图数据集,该数据集将被发布以促进抠图技术的发展。
4. 实验验证 :在三个抠图数据集上的实验表明,所提出的 TransMatting 方法优于当前的 SOTA 方法,证明了所提出模块的有效性。
3. 相关工作
3.1 传统抠图方法
传统抠图方法主要分为基于采样和基于传播的方法。这些方法主要依
超级会员免费看
订阅专栏 解锁全文
1416

被折叠的 条评论
为什么被折叠?



