
半监督/弱监督/无监督学习
文章平均质量分 93
涵盖各类非全监督学习
CVHub
专注多模态视觉语言AI全栈知识分享,提供原创、多领域、有深度的前沿AI论文解读与工业成熟解决方案
展开
-
ICCV 2023 | 克服域差异:基于事件相机的自监督预训练策略
论文:《Event Camera Data Pre-training》链接:https://arxiv.org/abs/2301.01928代码:https://github.com/Yan98/Event-Camera-Data-Pre-training。原创 2023-09-09 10:41:54 · 219 阅读 · 0 评论 -
ICCV 2023 | Pixel-based MIM: 简单高效的多级特征融合自监督方法
像素级 MIM 旨在预测原始或后处理图像的原始像素值。该过程可以视为去噪自编码器,并遵循简单的流程。对于被遮挡的图像,可以将可见标记和/或遮挡标记送入编码器;如果仅使用可见标记,那么遮挡标记和编码器输出的潜在特征都必须送入解码器。在这项研究中,研究人员系统地探索了等向性架构(如ViT)中多层特征融合在遮挡图像建模中的应用。通过一项初步实验,揭示了浅层低级特征在像素重建任务中的重要性,并在 MAE 和 PixMIM 两种像素级 MIM 方法中应用了简单直观的多层特征融合策略,实现了显著的性能提升。原创 2023-08-12 23:40:48 · 726 阅读 · 0 评论 -
沈春华团队新作 | Matcher: 颠覆图像理解,释放视觉任务的无限潜力!
本文介绍了 Matcher,一个无需训练的框架,用于解决各种少样本分割任务。Matcher 将通用特征提取模型和无类别分割模型进行合理组合,实现了正面的协同效应,并呈现出超越单个模型的复杂能力。引入的通用组件,如双向匹配、鲁棒的提示采样器和实例级匹配,能够有效释放这些基础模型的能力。后续的实验也证明了 Matcher 在各种少样本分割任务上的强大性能,可视化结果展示了其在真实场景中的开放世界泛化性和灵活性。原创 2023-06-05 00:01:49 · 481 阅读 · 0 评论 -
MICCAI 2023 | SCP-Net: 基于一致性学习的半监督医学图像分割方法
本文提出了一种新颖的方法SCP-Net,通过自感知和跨样本原型学习,改进了半监督医学图像分割中的一致性学习方法。实验结果表明,该方法在利用有限标注数据的情况下,能够取得比其他最先进的半监督方法更好的分割性能。原创 2023-06-04 23:55:50 · 1252 阅读 · 0 评论 -
ICML 2023 | 究竟MAE与对比学习怎样结合才是最优的?ReCon来告诉你答案
本文首发于微信公众号 CVHub,严禁私自转载或售卖到其他平台,违者必究。原创 2023-06-04 23:40:43 · 355 阅读 · 0 评论 -
ICLR 2023 | ACT: 2D视觉或语言Foundation Model可以帮助3D表征学习吗?
本文首发于微信公众号 CVHub,严禁私自转载或售卖到其他平台,违者必究。原创 2023-06-04 23:37:25 · 273 阅读 · 0 评论 -
IJCAI 2023 | 腾讯优图新作 CECNet: 提升小样本学习在分类、检测和分割任务上的性能
本文提出了一种用于小样本分类的新型聚类-补丁元素连接网络CECNet。首先,作者设计了一个聚类-补丁元素连接(CEC)层,通过元素间的连接将查询特征的目标区域加强为聚类-补丁特征。然后,本文继而提出了三个有用的基于 CEC 的模块。其中,CECM 和 Self-CECM 用于生成更具区分度的特征表示,CECD 距离度量获得可靠的相似性图。广泛的实验结果证明所提方法的有效性,并在小样本分类基准测试中取得了最先进的成果。原创 2023-05-04 00:22:25 · 667 阅读 · 0 评论 -
CVPR2023 超高分论文 | Consistent-Teacher: 高效目标检测超强 SOTA!
半监督学习SSL是一种利用少量有标签数据和大量无标签数据进行训练以提高模型性能的机器学习方法。在图像分类、目标检测等领域,SSL 已经被广泛应用。在目标检测领域,半监督目标检测SSOD能够有效利用大量无标注数据进行训练,具有重要的应用价值。SSOD 的基本模式是模式 [4][5][6][7]。该方法首先利用少量已标注数据对初始模型进行训练,同时使用教师模型对大量未标注数据进行推断,并将推断结果作为伪标签加入训练集。期望学生模型能够准确检测这些伪标签,并对增强后的输入样本做出一致的预测。原创 2023-04-22 13:54:11 · 3115 阅读 · 0 评论 -
全网最详细的 DINOv2 论文解读来啦!
本文介绍了第一个基于图像数据的 SSL 工作——DINOv2,这是一种用于在大型图像数据集上预训练图像编码器,以获得具有语义的视觉特征。这些特征可用于广泛的视觉任务,无需微调即可获得与有监督模型相当的性能。该方法的关键是基于精心设计的数据流管道构建大规模的图像数据集,以及一些技术改进,如 Stochastic Weight Averaging、Efficient Stochastic Depth和Fully-Sharded Data Parallel等。原创 2023-04-22 13:52:41 · 18685 阅读 · 0 评论 -
重塑自监督学习: DINO 网络如何颠覆视觉特征表示的常规方法
本文主要向大家介绍 DINO,这是第一篇探索 ViT 模型在自监督学习领域的经典代表作。DINO 整体架构基于自蒸馏的范式进行构建,包含一个教师网络和学生网络。其中,学生网络学习从局部补丁预测图像中的全局特征,该补丁受动量教师网络嵌入的交叉熵损失的监督,同时进行居中和锐化以防止模式崩溃。最后,再唠一句,想必关注 CV 大事的朋友都知道,最近 DINO v2 出来了,让我们拭目以待吧!原创 2023-04-22 13:46:10 · 2822 阅读 · 1 评论 -
以CVPR2023的半监督语义分割工作UniMatch为例,聊聊一篇顶会论文的idea是如何获得并实现大幅超越以往方法的性能!
在本工作中,我们展示了FixMatch迁移到半监督语义分割任务中的有效性。我们通过消融实验验证了强扰动的重要性,并进一步通过特征强扰动扩展了FixMatch的扰动空间,以及通过双路强扰动来更充分地探索原扰动空间。所提方法十分简单有效,在自然图像、遥感影像变化检测以及医学图像分割中都取得了最优的性能。此外,我们也有另外几个半监督语义分割相关的工作被CVPR[Paper][Code][Paper][Code][Paper][Code]原创 2023-04-22 13:39:26 · 3038 阅读 · 1 评论 -
R2AU-Net: 基于循环残差注意力和半监督学习范式的道路裂缝分割算法
基于道路裂缝分割的工作主要可分为两类,即基于传统图像处理算法和基于现代深度学习算法。今天给大家介绍的这篇工作本身没什么创新性,旨在传递给大家一个观点。就是现有的网络基础架构其实已经发展得很成熟了,无论是经典的 CNNs 还是近几年大火的 Transformer,现在新出的工作几乎都是大力出奇迹的节奏,通过堆积显卡跑消融实验发篇论文,真心不建议大多数小伙伴去卷这个方向。反而像今天这篇工作,笔者感觉真挺好,结合已有的工作探索一些新的“组合”,多去尝试解决一些实际的场景。原创 2023-03-24 00:03:53 · 1114 阅读 · 3 评论 -
如何用YOLOv5玩转半监督(附源码实现)
本文提出了一种名为SSDA-YOLO的新型半监督跨域目标检测方法。同以往大部分基于二阶段的目标检测器 Faster-RCNN 方法不同,本文采用更实用的 YOLOv5 作为基础的检测器。具体来说,这个框架包含三个有效的组件。首先,基于知识蒸馏结构,我们分别学习作为学生网络的 YOLOv5 和基于教师网络的 Mean Teacher 模型,以构建稳健的训练。其次,通过执行风格转移以交叉生成伪标签训练图像以减轻全局域差异。最后,应用一致性损失函数来校正来自不同域但具有相同标签的图像的预测偏移。原创 2023-03-24 00:07:50 · 1852 阅读 · 1 评论 -
CVPR 2023 | iTPNs: 谁说 Linear probing 不适用 MIM 任务?
掩码图像重建是一种利用图像掩码去执行计算机视觉任务的技术。相比于基于对比学习等方法,基于 MIM 的方法能提供更有竞争力的结果。说到这,那就让我们先简单回顾下对比学习的知识吧。本文提出了一个用于预训练 HiViT 的完整框架,其核心贡献在于利用特征金字塔统一重建和识别任务,从而最大限度地减少预训练和微调任务之间的迁移差距。此外,为了更好的优化特征金字塔,本文提出了一种掩码特征建模任务,旨在补充掩码图像建模能力。最后,预训练的 iTPN 在一些主流的视觉识别任务中报告了卓越的识别能力。原创 2023-03-19 10:18:33 · 517 阅读 · 0 评论 -
如何用YOLOv5玩转半监督(附源码实现)
如何用YOLOv5玩转半监督(附源码实现)原创 2023-02-18 09:52:09 · 1995 阅读 · 2 评论 -
用于半监督医学图像分割的多模态对比互学习和伪标签再学习方法
用于半监督医学图像分割的多模态对比互学习和伪标签再学习方法原创 2023-02-17 22:53:26 · 2734 阅读 · 0 评论