
分割任务
文章平均质量分 90
图像分割是一个重要的计算机视觉任务。
有为少年
一步步,一点点
展开
-
CVPR 2024 | Rethinking Interactive Image Segmentationwith Low Latency, High Quality, and Diverse Pro
现有的专家模型和通用模型在实现低延迟、高质量的交互式分割以及支持多种提示方面存在困难。研究人员提出了一种名为 SegNext 的方法,它重新引入了专家模型中常用的密集视觉提示的表示和融合方式,以促进高质量的分割。是实现高质量分割的关键设计选择。与现有的专家模型相比,该方法能够在保持低延迟的同时实现更好的分割效果。相比之下,本文提出的方法通过引入密集的视觉提示和优化模型结构,实现了低延时和高性能的图像分割效果。这篇文章主要研究了如何在保持低延迟的同时提高交互式图像分割的质量,并实现多种提示的兼容性。原创 2024-04-11 13:02:15 · 695 阅读 · 0 评论 -
CVPR 2024 | OVFoodSeg: Elevating Open-Vocabulary Food Image Segmentation via Image-Informed Textual
在整合视觉语言模型 CLIP 的基础上,为了处理食物配料视觉表征中大的类内方差,该方法集成了两个创新模块,即图像到文本学习器 FoodLearner 和图像感知的文本编码器 Image-Informed Text Encoder,丰富了文本嵌入与图像特定的信息,从而有效地将知识从已知的食材转移到新的食材。通过在大规模食品相关图像文本对数据集上预训练 FoodLearner,OVFoodSeg 成功地将视觉信息与文本表示紧密地联系起来,从而有效地解决了食材图像分割中的大类内变化问题。原创 2024-04-11 12:56:53 · 938 阅读 · 0 评论 -
ECCV 2022 | Learning Implicit Feature Alignment Function for Semantic Segmentation概述与代码分析
基于隐神经表示设计了一种隐式特征对齐函数,来替换现有的基于插值的不同分辨率特征对齐方案。可以更加方便和高效的对齐多个不同分辨率的特征。原创 2023-07-27 09:00:00 · 964 阅读 · 0 评论 -
CVPR 2023 | SAN: Side Adapter Network for Open-Vocabulary Semantic Segmentation
基于CLIP构建开放词汇语义分割模型。原创 2023-06-30 11:37:15 · 2873 阅读 · 0 评论 -
CAT-Seg: Cost Aggregation for Open-Vocabulary Semantic Segmentation
基于图像文本匹配的cost volume细化与预测分割。原创 2023-06-07 11:04:21 · 2606 阅读 · 0 评论 -
CVPR 2023 | FreeSeg: Unified, Universal and Open-Vocabulary Image Segmentation
Open Vocabulary 学习范式将分割系统推广到更通用的应用场景. 现有的定制化的设计范式导致各种分割任务之间的碎片化, 从而阻碍了分割模型的统一性.所以本文基于one-shot训练的形式, 提出了一种统一参数和结构的通用模型用于处理 Open Vocabulary 分割任务.并引入了prompt来统一不同的任务和类别概念, 以适应不同的任务和场景.原创 2023-04-14 17:18:30 · 2808 阅读 · 3 评论 -
ECCV 2022 | MaskCLIP: Extract Free Dense Labels from CLIP
以往的研究主要是利用CLIP特征作为一种全局图像表示,本文主要探索预训练的CLIP模型对于像素级预测任务的潜在优势。原创 2023-04-14 16:55:07 · 3028 阅读 · 3 评论 -
CVPR | Generative Semantic Segmentation
使用生成方法建立的图像分割模型原创 2023-04-06 14:33:21 · 2567 阅读 · 3 评论 -
各种 Dice Loss 变体
Dice Loss也是图像分割任务中非常常见的一个损失函数。本文基于 [Generalised Wasserstein Dice Score for Imbalanced Multi-class Segmentation using Holistic Convolutional Networks](https://arxiv.org/abs/1707.00478) 中的内容进行了整理。原创 2022-10-29 11:49:41 · 2781 阅读 · 0 评论 -
图像分割之Dense Prediction with Attentive Feature Aggregation
Dense Prediction with Attentive Feature Aggregation原始文档: https://www.yuque.com/lart/papers/xnqoi0偶然间从 arxiv 上翻到的论文, 可以看做是对之前工作 Hierarchical multi-scale attention for semantic segmentation 的一个扩展.从摘要读论文Aggregating information from features across differ原创 2021-11-04 23:03:15 · 465 阅读 · 0 评论 -
Vision Transformer之Pyramid Vision Transformer
Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions文章目录Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions前言与ViT和CNN的比较下游任务分类检测分割其他的一些细节链接原始文档:https://www.yuque.com/lart/paper原创 2021-02-27 00:57:44 · 4087 阅读 · 9 评论 -
视频目标分割之See More, Know More: Unsupervised Video Object Segmentation with Co-Attention Siamese Network
See More, Know More: Unsupervised Video Object Segmentation with Co-Attention Siamese Networks文章目录See More, Know More: Unsupervised Video Object Segmentation with Co-Attention Siamese Networks亮点任务介绍方...原创 2020-04-30 12:40:54 · 2654 阅读 · 0 评论