- 博客(316)
- 资源 (9)
- 问答 (1)
- 收藏
- 关注

原创 变化检测(Change Detection,CD) 综述2篇 & CD代码 & 常用CD数据集及链接
CD best paper 。综述1,介绍变化检测流程、各种类型的CD数据集、分析不同的算法框架与当前AI主流网络,实际应用,机遇与挑战(无监督、异构数据、是否可靠),内容丰富。综述2,包括,遥感领域中变化检测的应用,深度学习算法概述(历史、deep models、DBNs、SAEs、CNNs),已有的CD相关论文的汇集整理分析和涉及的期刊会议,大致分为三组(有监督、无监督CD、迁移学习),有前途的研究方向(强化学习、弱监督学习)。对比之下,综述2适合简单的入门科普,综述1更为深刻,值得细读。
2022-11-22 10:10:21
15208
5

原创 【综述】Transformers in Remote Sensing: A Survey
第一次系统地审查在遥感中基于变压器的最新进展。我们的调查涵盖了60多种最新的基于变压器的方法,用于遥感领域的不同遥感问题:甚高分辨率(VHR)、高光谱(HSI)和合成孔径雷达(SAR)图像。我们通过讨论变压器在遥感方面的不同挑战和开放问题来结束调查。
2022-11-04 00:38:42
4080
2

原创 近年 计算机视觉 会议 论文 网站
2021年和2022年的顶会论文与代码分享,包括有ECCV2022,CVPR2022,CVPR2021,ICCV2021,推荐系统相关(ACL、SIGIR、NeurIPS、RecSys、KDD、CIKM、WWW、IJCAI)
2022-10-16 21:13:25
1377

原创 github资源收藏地
不定期更新,收集整理的github资源,有关CV各个方向(异常检测、语义分割、医学图像、Transformer、attention、yolo系列)、算法、就业、论文、cv资源、摄影。
2022-10-05 20:44:02
3050
原创 【论文笔记】利用扩散模型DDPM做变化检测change detection
去噪扩散模型DDPM去年开始在各种视觉任务取得惊人的效果,变化检测领域也不例外,本文介绍两篇关于如何使用扩散模型实现变化检测的论文。第一篇做法较为自然,先利用遥感数据预训练DDPM,然后将预训练好的网络当作变化检测任务的特征提取器;第二篇则更有意思,不再进行像素分类,而是直接利用扩散模型生成变化图。
2024-05-12 23:25:56
3656
2
原创 【NeurIPS 2023】PromptIR: Prompting for All-in-One Blind Image Restoration
图像恢复是从其受损版本中恢复高质量清晰图像的过程。deep-learning方法显著提升了图像恢复性能,然而,它们在不同类型和级别的退化上的泛化能力有限。这限制了它们在实际应用中的使用,因为需要针对每种具体的退化进行单独训练模型,并了解输入图像的退化类型才能应用相应的模型。本文介绍了一种基于提示的学习方法,称为PromptIR,用于全能图像恢复,可以有效地从各种类型和级别的退化中恢复图像。具体而言,本文方法使用提示来编码退化特定信息,并动态引导恢复网络。
2023-12-02 17:34:36
2999
3
原创 【IJCAI2022】Uncertainty-Guided Pixel Contrastive Learning for Semi-Supervised Medical Image Segmentat
论文将对比学习引入半监督分割,并提出了一种新的不确定性引导的半监督医学图像分割像素对比学习方法。具体来说,为每个未标记的图像构建一个不确定性图,然后重新移动不确定性图中的不确定性区域,以降低噪声采样的可能性。不确定性图由精心设计的一致性学习机制确定,该机制通过鼓励来自两个不同解码器的一致性网络输出来生成对未标记数据的全面预测。此外,论文认为由图像编码器学习的有效全局表示对于不同的几何变换应该是等变的,于是构造了一个等变对比损失来增强编码器的全局表示学习能力。
2023-11-26 18:10:59
1479
原创 【半监督学习】CNN与Transformer的结合
本文介绍了几篇结合使用CNN和Transformer进行半监督学习的论文,CNN&Trans(MIDL2022),Semi-ViT(ECCV2022),Semiformer(ECCV2022)。
2023-11-19 20:01:53
4268
原创 【TGRS 2023】RingMo-Sense: Remote Sensing Foundation Model for Spatiotemporal Prediction via Spatiotem
遥感时空预测旨在从视频和时间序列图像等历史时空数据中推断未来趋势,在许多领域具有广泛的应用前景。基础模型由于其强大的特征提取能力,是时空信息挖掘的一个很有前途的研究方向,在自然场景中取得了快速的进展。然而,由于遥感数据的空间多尺度和时间多尺度特性,这些方法在应用于遥感时仍然会遇到瓶颈。因此,论文提出了一种基于时空演化去模糊的时空预测遥感基础模型,简称RingMo-Sense。考虑到空间亲和性、时间连续性和时空相互作用,论文构建了空间、时间和时空三分支预测网络。
2023-11-11 23:54:24
1601
原创 【ICCV 2023】EfficientViT: Multi-Scale Linear Attention for High-Resolution Dense Prediction
高分辨率密集预测得到越来越多的应用,如计算摄影、自动驾驶等。然而,巨大的计算成本使得在硬件设备上部署最先进的高分辨率密集预报模型变得困难。本文提出EfficientViT,一个新的高分辨率视觉模型家族,具有新颖的多尺度线性特性。不同于现有的高分辨率密集预测模型依赖于大量的softmax注意力、硬件低效的大内核卷积或复杂的拓扑结构来获得良好的性能,多尺度线性注意力只需轻量级和硬件高效的操作就可以实现全局感受野和多尺度学习(高分辨率密集预测的两个理想特征)。
2023-11-02 20:30:49
5605
1
原创 【TGRS 2023】RingMo: A Remote Sensing Foundation ModelWith Masked Image Modeling
深度学习方法促进了遥感 (RS) 图像解释的快速发展。最广泛使用的是利用ImageNet预训练模型来处理指定任务的 RS 数据。然而,存在自然场景与RS场景之间的领域差距,以及 RS模型泛化能力差 等问题。开发具有通用 RS 特征表示的基础模型是有意义的。由于有大量未标记的数据可用,自监督方法在遥感方面比全监督方法具有更大的发展意义。然而,目前大多数自监督方法都使用 对比学习,其性能对数据增强、附加信息以及正负对的选择很敏感。本文利用。
2023-10-25 22:09:18
3091
原创 【综述】Diffusion Models: A Comprehensive Survey of Methods and Applications
论文:github:Conditional Image Generation (Image Super Resolution, Inpainting, Translation, Manipulation)
2023-10-19 21:57:57
3022
转载 【论文合集】Awesome Diffusion Models 3
介绍使用diffusion来实现多模态学习、3D视觉、对抗攻击,以及语音领域的生成、增强等任务。
2023-10-17 15:52:27
25172
转载 【论文合集】Awesome Diffusion Models 2
介绍diffusion做生成、分类、分割、图像翻译、医学图像的论文。来源:https://github.com/diff-usion/Awesome-Diffusion-Models
2023-10-17 12:56:41
8216
原创 ubuntu修改IP地址
面对ubuntu18以上的版本,主要有两种界面:图形化界面和纯命令行界面。图形化界面配置比较简单,命令行配置稍许复杂,但方便。
2023-10-14 13:20:23
26033
原创 【CVPR 2023】 All are Worth Words: A ViT Backbone for Diffusion Models
文中首次使用U-Net建模score-based model (即diffusion model),后续DDPMADMImagen等许多工作对U-Net进行了一系列改进。目前,绝大多数扩散概率模型的论文依然使用U-Net作为主干网络。ViT在各种视觉任务中显示出了前景,而基于CNN的U-Net在扩散模型中仍然占主导地位。论文设计了一种简单通用的基于ViT的架构(命名为U-ViT),用于使用扩散模型生成图像。
2023-10-10 21:55:10
2816
原创 【论文合集】Awesome Video Diffusion
A curated list of recent diffusion models for video generation, editing, restoration, understanding, nerf, etc.
2023-10-07 15:08:45
2573
原创 【arXiv2309】RingMo-lite: A Remote Sensing Multi-taskLightweight Network with CNN-TransformerHybrid Fr
近年来,RingMo的遥感(RS)视觉基础模型在各种下游任务中取得了优异的性能。然而,对计算资源的高需求限制了这些模型在边缘设备上的应用。有必要设计一个更轻量级的基础模型来支持在轨遥感图像解释。现有方法在实现轻量级解决方案的同时在RS图像解释中保持通用性方面面临挑战。这是由于RS图像中复杂的高频和低频频谱分量,使得传统的单一CNN或视觉变换器方法不适合该任务。因此,本文提出了RingMo-lite,一个具有CNN-Transformer混合框架的RS多任务轻量级网络,它有效地利用了RS的频域特性。
2023-10-04 15:03:31
3015
1
转载 【NeurIPS 2023】Toward Understanding Generative Data Augmentation
生成式数据扩增通过条件生成模型生成新样本来扩展数据集,从而提高各种学习任务的分类性能。然而,很少有人从理论上研究生成数据增强的效果。为了填补这一空白,论文在这种非独立同分布环境下构建了基于稳定性的通用泛化误差界。基于通用的泛化界,论文进一步了探究了高斯混合模型和生成对抗网络的学习情况。在这两种情况下,论文证明了,虽然生成式数据增强并不能享受更快的学习率,但当训练集较小时,它可以在一个常数的水平上提高学习保证,这在发生过拟合时是非常重要的。
2023-10-03 16:34:24
2702
原创 【CVPR 2023】EfficientViT: Memory Efficient Vision Transformer with Cascaded Group Attention
Vision Transformer由于其高度的建模能力而取得了巨大的成功。然而,它们的卓越性能伴随着沉重的计算代价,不适合于实时应用。本文提出了一个高速ViT,即EfficientViT。论文发现,现有的Transformer模型的速度通常受到访存效率低的操作的限制,尤其是在MHSA中的张量重塑和逐元素函数。因此,论文设计了一种新的三明治布局的构建块,即在有效的FFN层之间使用单个内存受限的MHSA,在增强通道通信的同时提高了访存效率。此外,注意力图在头部之间有很高的相似性,导致计算冗余。
2023-10-03 11:15:27
6847
1
原创 【推荐系统】多任务学习模型
介绍一些多任务学习模型了解是如何处理多任务分支的。如ESSM,MMoE,PLE,DSSM,GateNet,GemNN。
2023-10-03 09:24:52
4912
原创 【轻量化网络】MobileNet系列
论文:https://arxiv.org/abs/1704.04861代码:解读:【图像分类】2017-MobileNetV1 CVPR_說詤榢的博客-优快云博客 论文:https://arxiv.org/abs/1801.04381代码:https://github.com/d-li14/mobilenetv2.pytorch解读:【图像分类】2018-MobileNetV2_[18]sandler m,howard a,zhu m,et al. mobilenetv2: i_說詤榢的博客-优快云博客
2023-09-09 16:25:23
2734
原创 【ICCV2023】Robustifying Token Attention for Vision Transformers
Vision Transformer在图像分类等任务中表现出色,但在面对常见的图像扰动(如噪声或模糊)时,其性能会显著下降。为此,论文对ViT的关键组成部分——自注意力机制进行研究分析,发现当前的视觉transformer模型在自注意力机制中存在"token overfocusing"的问题,即注意力机制过度依赖于少数重要token。然而这些token对图像扰动非常敏感。Token-aware Average Pooling(TAP)和Attention Diversification Loss(ADL)
2023-08-28 22:33:24
2980
原创 【ECCV2022】Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation
文如题名,本文使用纯Transformer构建Unet网络,用于医学图像分割。本文用Swin Transformer替换Unet全部结构,构建出Swin-UNet。
2023-08-22 21:04:49
3743
原创 【ICCV2021】Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions
PVT 把金字塔结构引入到Transformer中,使其可以无缝接入各种下游任务。简单调整Multi-Head Attention,提出spatial reduction attention。本文仿照CNNs中常见的金字塔结构,改进原始的Transformer,划分多个stage,每个stage的长宽减半,通道维度增加,再把多个stage进行叠加。以应用于分类、检测、分割等任务。
2023-08-22 19:36:47
2990
原创 【ICCV2023】Adaptive Frequency Filters As Efficient Global Token Mixers
最近的vision transformer、大核CNN和MLP由于其在全局范围内的有效信息融合,在视觉任务中取得了显著的成功。然而,由于自注意机制、大内核或全连接层的高昂计算成本,它们的高效部署,特别是在移动设备上的高效部署仍然面临着值得注意的挑战。这项工作,将传统的卷积定理应用于深度学习,以解决这一问题,并揭示自适应频率滤波器可以作为有效的全局令牌混频器。基于此,论文提出了自适应频率滤波(AFF)令牌混频器:Adaptive Frequency Filtering token mixer。
2023-08-21 10:10:34
3954
2
原创 【论文综述】Transformer 综述
中国科学院、东南大学等联合发表最新的视觉 Transformer 综述_中科院AI算法工程师的博客-优快云博客Transformer综述大全(1)【A Survey of Visual Transformers】_香博士的博客-优快云博客Transformer综述大全(2)【A Survey of Visual Transformers】_香博士的博客-优快云博客_transformer综述[Transformer]A Survey on Vision Transformer_黄小米吖的博客.
2023-08-18 22:04:28
2763
原创 【图像分类】CNN + Transformer 结合系列.4
介绍两篇利用Transformer做图像分类的论文:CoAtNet(NeurIPS2021),ConvMixer(ICLR2022)。CoAtNet结合CNN和Transformer的优点进行改进,ConvMixer则patch的角度来说明划分patch有助于分类。
2023-08-09 16:23:26
7234
原创 【arXiv2306】CrossKD: Cross-Head Knowledge Distillation for Dense Object Detection
知识蒸馏(KD)已被验证为一种有效的学习压缩对象检测器的模型压缩技术。现有的最先进的目标检测KD方法大多基于特征模拟,通常观察到这比预测模拟更好。本文发现,GT信号和蒸馏目标之间的优化目标不一致是预测模拟效率低下的关键原因。为了缓解这个问题,论文提出一种简单而有效的蒸馏机制 CrossKD,它将学生模型检测头的中间特征传递给教师模型检测头,并强制使交叉头的预测与教师模型的预测保持一致。
2023-08-05 20:07:37
3465
3
原创 【图像分类】CNN+Transformer结合系列.3
介绍两篇图像分类的论文:ResMLP(arXiv2305),MetaFormer(CVPR2022),两者都与Transformer有关系,前者基于transformer结构的特点设计ResMLP,后者认为宏观架构才是Transformer成功的原因并设计一个简单的PoolFormer结构。
2023-07-31 13:17:35
6742
原创 【图像分类】CNN+Transformer结合系列.2
介绍几篇利用CNN+Transformer实现图像分类的论文:CMT(CVPR2022),MaxViT(ECCV2022),MaxViT(ECCV2022),MPViT(CVPR2022)。主要是说明Transformer的局限性,然后利用CNN的优势去弥补和结合。
2023-07-28 17:42:01
8055
原创 【arXiv2306】1M parameters are enough? A lightweight CNN-based model for medical image segmentation
卷积神经网络(CNNs)和基于Transformer的模型由于能够提取图像的高级特征和捕捉图像的重要方面而被广泛应用于医学图像分割。然而,在对高精度的需求和对低计算成本的期望之间往往存在权衡。具有更高参数的模型理论上可以获得更好的性能,但也会导致更高的计算复杂性和更高的内存使用率,因此实现起来并不实用。本文寻找一种轻量级的基于U-Net的模型,它可以保持不变,甚至实现更好的性能,即U-Lite。基于深度可分离卷积的原理设计了U-Lite,既可以利用细胞神经网络的强度,又可以减少大量的计算参数。
2023-07-25 19:44:21
3519
原创 【ICCV2023】ARS-DETR: Aspect Ratio Sensitive Oriented Object Detection with Transformer
现有的目标检测方法通常使用度量AP50来度量模型的性能。论文认为AP50的角度偏差公差较大,本质上不适合旋转目标检测。因此,论文提倡使用高精度度量,如AP75,来衡量模型的性能。(论文的检测器在AP75上效果比较好,在AP50上效果不行)本文提出了基于Transformer的高宽比敏感的旋转目标探测器,称为ARS-DETR,它在高精度面向目标检测中具有竞争力的性能。提出了一种新的角度分类方法,称为高宽比感知圆光滑标签(AR-CSL),以更合理的方式平滑角度标签,并丢弃之前工作中引入的超参数(如CSL)。
2023-07-25 16:25:10
4469
运用K-Means算法挖掘高价值B站up主.docx
2022-01-03
基于YOLOv5的道路裂缝检测.docx
2022-01-03
基于HOG特征与SVM算法的图像分类 .docx
2022-01-03
基于QAR数据聚类分析的航班异常检测.docx
2022-01-03
SOTR Segmenting Objects with Transformers.pdf
2021-11-29
如何两张图片的特征分布的相似度,佬们求解
2022-11-04
如何两张图片的特征分布的相似度,佬们求解
2022-11-04
对三通道图像进行nn.Conv2d (3,3)卷积,再保存为三通道图,两图差异大吗?
2022-10-24
关于使用opencv内置函数拼图时无法获取单应矩阵及生成图像的矩阵问题
2022-01-07
TA创建的收藏夹 TA关注的收藏夹
TA关注的人