- 博客(56)
- 收藏
- 关注
翻译 [CR]厚云填补_MPRNet
图像恢复任务在恢复图像时需要空间细节和高级上下文信息之间的复杂平衡。在这篇论文中,我们提出了一种新的协同设计,可以最佳地平衡这些相互竞争的目标。我们的主要建议是采用多阶段架构,逐步学习退化输入的恢复功能,从而将整体恢复过程分解为更易于管理的步骤。具体来说,我们的模型首先使用编码器-解码器架构学习上下文特征,然后将它们与保留本地信息的高分辨率分支相结合。在每个阶段,我们引入了一种新颖的每像素自适应设计,该设计利用现场监督注意力来重新加权局部特征。这种多阶段架构的一个关键要素是不同阶段之间的信息交换。
2025-03-12 21:51:24
162
翻译 [CR]厚云填补_MemoryNet
图像恢复数据低级视觉任务,大部分CNN方法被设计为黑盒,缺乏透明度和内部美观性,虽然也提出了一些将传统优化算法与DNN相结合的方法,但是都存在一定的局限性。本文提出一种三粒度记忆层与对比学习的MemoryNet。具体来说,将样本分为正、负、实三个样本进行对比学习,记忆层能够保留图像的深层特征,对比学习使学习到的特征收敛到平衡。在Derain/Deshadow/Deblur任务上的实验表明,这些方法对提升恢复的性能有效。
2025-02-13 17:17:54
68
翻译 [DL]深度学习_ControlNet
我们提出了 ControlNet,这是一种神经网络架构,用于向大型、预训练的文本到图像扩散模型添加空间调节控制。ControlNet 锁定了可用于生成的大型扩散模型,并重新使用经过数十亿张图像预训练的深度和稳健的编码层作为强大的主干来学习一组多样化的条件控制。神经架构与“零卷积”(零初始化卷积层)相连,这些卷积层从零开始逐步增加参数,并确保没有有害噪音会影响微调。我们使用稳定扩散测试了各种条件控制,例如边缘、深度、分割、人体姿势等,使用单个或多个条件,有或没有提示。
2024-12-29 22:07:26
129
翻译 [DL]深度学习_向量量化变分自编码器VQ-VAE
在没有监督的情况下学习有用的表示仍然是机器学习的一个关键挑战。在本文中,我们提出一个简单但是功能强大的生成模型来学习这种离散表示。向量量化变分自编码器(Vector Quantised-Variational AutoEncoder,VQ-VAE),与VAE相比,在两个关键方面有所不同:编码器网络输出离散代码,而不是连续代码;先验是学习的,而不是静态的。为了学习离散潜在表示,我们结合了向量量化的思想。
2024-12-29 17:49:45
270
翻译 [DL]深度学习_Latent Diffusion Models
通过将图像形成过程分解为去噪自编码器的顺序应用,扩散模型(DMs)在图像数据和其他数据上实现了最先进的合成结果。此外,它们的组件允许一个指导机制来控制图像生成过程,而无需再训练。然而,由于这些模型通常直接在像素空间中操作,因此优化功能强大的dm通常会消耗数百个GPU天,并且由于顺序评估而导致推理成本高昂。为了使DM训练在有限的计算资源上同时保持其质量和灵活性,我们将它们应用于强大的预训练自编码器的潜在空间。
2024-12-12 10:46:45
152
原创 [DL]深度学习_扩散模型基础原理
扩散模型运行原理首先sample一个都是噪声的图片向量,这个向量的shape和要生成的图像大小相同。通过Denoise过程来一步一步有规律的滤去噪声。Denoise的次数是事先规定的,给每一个步骤给定编号,最终步骤编号为1。从噪声到图像的过程称为Reverse Process雕像已经在大理石里边了,我只是把不要的部分凿掉。--米开朗基罗将相同的Denoise model反复进行图像去噪过程,但是每一个步骤阶段输入的噪声图像之间差别很大。
2024-08-18 20:28:00
1156
原创 [CR]厚云填补_GridFormer
恶劣天气条件下的图像恢复是计算机视觉中的一个难点。在本文中,我们提出了一种新的基于变压器的框架GridFormer,它可以作为恶劣天气条件下图像恢复的支柱。GridFormer采用剩余密集变压器块在网格结构中进行设计,并介绍了两种核心设计。首先,它在变压器层使用增强的注意机制。该机制包括采样器和紧凑自关注阶段以提高效率,以及局部增强阶段以加强局部信息。其次,我们引入了一个残余密集变压器块(RDTB)作为最后的GridFormer层。这种设计进一步提高了网络从之前和当前的局部特征中学习有效特征的能力。
2024-08-04 16:46:29
901
原创 [CR]厚云填补_GridDehazeNet+
雾霾等恶劣天气条件会降低自动驾驶和智能交通系统的性能。作为一种潜在的补救措施,我们提出了一种增强的多尺度网络,称为GridDehazeNet+,用于单幅图像去雾。提出的除雾方法不依赖于大气散射模型(ASM),并解释了为什么不一定执行该模型提供的降维。GridDehazeNet+由预处理、主干和后处理三个模块组成。与手工选择的预处理方法产生的衍生输入相比,可训练的预处理模块可以生成具有更好多样性和更相关特征的学习输入。通过不同尺度的密集连接有效缓解瓶颈问题的新颖网格结构;
2024-08-02 19:57:49
779
原创 [CR]厚云填补_GridDehazeNet
我们提出了一个端到端的可训练卷积神经网络(CNN),命名为GridDehazeNet,用于单幅图像去雾。GridDehazeNet由预处理、主干网络和后处理三个模块组成。与手工选择的预处理方法产生的衍生输入相比,可训练的预处理模块可以生成具有更好多样性和更相关特征的学习输入。该核心模块实现了一种基于注意力的网格网络多尺度估计方法,有效地解决了传统多尺度估计方法存在的瓶颈问题。后处理模块有助于减少最终输出中的伪影。实验结果表明,GridDehazeNet在合成图像和真实图像上的表现都优于最先进的技术。
2024-08-01 17:24:11
869
原创 [CR]厚云填补_Grid Network
本文提出了一种新的卷积神经网络架构GridNet,用于语义分割(全场景标记)。经典神经网络实现为从输入到输出的一个流,并在流中应用下采样算子,以减少特征映射的大小并增加最终预测的接受场。然而,对于语义图像分割,其任务是为图像的每个像素提供语义类,特征映射减少是有害的,因为会导致输出预测中的分辨率损失。为了解决这个问题,GridNet遵循一种网格模式,允许多个相互连接的流以不同的分辨率工作。表明,网格网络推广了许多众所周知的网络,如Conv-deconv,残差网络或U-Net网络。
2024-08-01 17:00:05
1261
原创 [CR]厚云填补_多云条件下土地覆盖分割的多模态多任务学习
地球的大部分表面被云层覆盖,导致光学图像遭受地面信息的严重退化。具有穿透云层能力的合成孔径雷达(SAR)图像可以为光学图像提供补充信息。因此,在多云条件下,光学影像与SAR影像的融合可以显著提高解译精度。在本文中,我们提出利用相关的去云任务对土地覆盖进行精确的多模态语义分割。为此,我们开发了一种端到端的可学习架构,该架构共同解决了云移除和土地覆盖语义分割的任务。云移除任务鼓励学习知识特征,以克服语义模糊的负面影响。实验表明,该算法能有效提高多云条件下的语义分割精度。
2024-07-27 18:23:56
1138
原创 [DL]深度学习_知识蒸馏
知识蒸馏网络是一种神经网络模型,用于将复杂模型的知识转移到简化的模型,以提高模型的性能和效率。它借鉴了知识蒸馏方法的思想,通过将复杂模型的知识传递给简化模型来实现模型压缩和加速。知识蒸馏网络的基本原理是通过引入一个教师模型(通常是一个复杂的模型,例如深度神经网络)来指导一个学生模型(通常是一个简化的模型,例如浅层神经网络)的训练。教师模型在训练过程中可以提供额外的信息,例如类别概率分布、中间层特征表示等,以帮助学生模型更好地学习。将知识从教师网络迁移到学生网络中。
2024-07-26 11:33:09
338
原创 [CR]厚云填补_综述整理
由于光学图像的局限性,其波段无法穿透云层,图像总会受到云层的污染,导致遮挡区域信息缺失,限制后续的应用。合成孔径雷达SAR能够提供全天候、全天时的地面信息。因此,平移SAR或融合SAR与光学图像获取无云的类光学图像是解决云污染问题的理想方法。在本文中,调查了现有文献,提供了两种分类方法,一种基于输入类型,另一种基于使用方法。同时,分析了使用不同数据作为输入时的优缺点。最后部分讨论了这些现有方法的局限性,提出该领域未来研究的几个可能方向。
2024-06-06 21:27:36
1057
原创 摄影测量学_知识点总结
航摄像片上的特殊点线面-摄影方向线。论述题-摄影测量技术的发展趋势。摄影测量基础知识-像主距。摄影测量常用坐标系-五大。航摄像片的内、外方位元素。投影基本知识-中心投影。航摄像片与地形图的区别。共线条件方程-一般形式。
2024-04-19 16:10:40
4696
原创 [SS]语义分割_Mask R-CNN
Mask R-CNN是一种用于物体检测和语义分割任务的深度学习模型。它是在Faster R-CNN的基础上进行改进的,通过增加一个分割分支,实现了物体检测和像素级别的语义分割。Mask R-CNN通过在RPN(Region Proposal Network)的基础上,增加了一个全连接层来生成每个候选框的分类概率和边界框回归信息。同时,它还为每个候选框添加了一个全卷积网络来生成候选框的mask分割。在训练过程中,Mask R-CNN除了进行物体分类和边界框回归的损失计算,还加入了语义分割的损失计算。
2024-03-05 11:03:52
1363
原创 [SS]语义分割_U-Net
U-Net是一种用于生物医学图像分割的卷积神经网络架构。它由Olaf Ronneberger等人在2015年提出,并被广泛应用于医学图像分析领域。U-Net的设计灵感来自于生物医学图像分割任务中常见的数据不平衡问题,即前景(感兴趣区域)与背景之间的像素数量差异很大。为了解决这个问题,U-Net使用了一种称为"U"形结构的编码-解码架构,其中编码器部分用于捕捉图像的上下文信息,而解码器部分用于恢复分辨率和帮助生成准确的分割结果。
2024-03-04 11:34:07
1262
原创 [SS]语义分割_DeepLab
(1)、将backbone更换为ResNet;(2)、引入了新结构ASPP。(1)、分辨率被降低,主要由于下采样步距s>1的层导致;(2)、目标的多尺度问题;(3)、DCNNs的不变性会降低定位精度。针对分辨率被降低的问题,通常将最后几个MaxPool层的步距s设置为1,如果是通过卷积下采样的(ResNet),同样将步距s设置为1,配合使用膨胀卷积。针对目标多尺度的问题,将图像缩放到多个尺度分别通过网络进行推理,最后将多个结果进行融合即可,但是这样做的计算量太大。
2024-02-29 11:27:41
1570
原创 [SS]语义分割_膨胀卷积
膨胀卷积(Dilated Convolution),也称为空洞卷积(Atrous Convolution),是一种在卷积神经网络中常用的操作。它通过在卷积核的周围插入一定数量的零值来改变卷积核的感受野大小。传统的卷积操作是在输入特征图上滑动卷积核,每次将卷积核中的权重与输入特征图的对应位置进行相乘并求和,从而得到输出特征图中的一个像素值。膨胀卷积则是在滑动卷积核时,通过在卷积核的元素之间插入一定数量的零值来扩大感受野,使得每个卷积核的有效感受野增大。
2024-02-28 11:20:08
1168
原创 [SS]语义分割_FCN全卷积网络
全卷积网络(Fully Convolutional Networks,FCN)是一种用于语义分割的深度学习网络模型。传统的卷积神经网络(CNN)常用于图像分类任务,但是对于像素级别的语义分割任务,需要输出每个像素的类别标签,CNN的全连接层并不能处理不同输入尺寸的图像,因此不能直接用于语义分割。FCN通过将全连接层替换为全卷积层,实现了端到端的像素级别的语义分割。FCN的网络结构由编码器和解码器组成。
2024-01-20 20:04:40
1577
原创 [SS]语义分割_转置卷积
转置卷积(Transposed Convolution),也被称为反卷积(Deconvolution)或逆卷积(Inverse Convolution),是一种卷积神经网络中常用的操作。转置卷积可以用于图像生成、图像分割、语义分割等任务中。转置卷积的操作实际上是卷积操作的逆过程。在标准的卷积操作中,输入数据经过卷积核的滑动窗口运算,生成输出特征图。而在转置卷积中,输出特征图经过转置卷积核的滑动窗口运算,生成输入数据的近似重构。转置卷积的操作可以用矩阵乘法的方式来实现,也可以用卷积的方式来实现。
2024-01-18 10:35:22
530
原创 [SS]语义分割——基础知识
语义分割(Semantic Segmentation)是计算机视觉中的一项任务,目标是将图像中的每个像素按其语义类别进行分类。与传统的目标检测不同,语义分割对图像中的每个像素都进行分类,而不是只关注物体的边界框。语义分割的目标是给图像中的每个像素分配一个类别标签,通常使用颜色编码来可视化不同的类别。例如,将图像中的道路像素标记为蓝色,建筑物像素标记为红色等。语义分割在许多计算机视觉任务中起到重要作用,如自动驾驶、智能监控、图像编辑等。
2024-01-17 17:42:13
1353
原创 遥感类SCI期刊_一区二区汇总
h-index:191区h-index:2381区h-index:1101区h-index:2161区h-index:761区h-index:342区h-index:02区h-index:02区h-index:812区h-index:802区h-index:642区h-index:371区h-index:01区。
2024-01-14 11:15:30
5004
原创 [DL]深度学习_Feature Pyramid Network
Feature Pyramid Network (FPN)是一种用于目标检测和语义分割的神经网络架构。它的目标是解决在处理不同尺度的图像时,信息丢失和语义细节模糊的问题。FPN的核心思想是通过在网络中添加一组横向连接来构建多尺度特征金字塔。这些横向连接将底层的高分辨率特征与高层的低分辨率特征进行融合,以捕捉不同尺度的语义信息。融合后的特征金字塔可用于检测和分割任务中的多尺度目标识别。具体来说,FPN在主干网络(如ResNet)中的每个阶段添加一个横向连接,以便从高层到底层传递信息。
2024-01-13 17:31:21
1792
原创 遥感图像分类与识别_知识点总结
遥感图像分类以遥感数字图像为研究对象,在计算机系统的支持下,综合运用地学分析、遥感图像处理、地理信息系统、模式识别与人工智能等技术,实现地学专题信息的智能化获取。其基本目标是将人工目视解译遥感图像发展为计算机支持下的遥感图像理解。
2023-12-28 21:02:27
5400
2
原创 [DL]深度学习_AlexNet
AlexNet是一种经典的卷积神经网络模型,由Alex Krizhevsky、Ilya Sutskever和Geoffrey E. Hinton于2012年提出。它是第一个在ImageNet比赛中获得冠军的深度神经网络模型,引领了深度学习在计算机视觉领域的发展。AlexNet的结构包含了8个图层,其中前5个是卷积层,后3个是全连接层。下面是对每个图层的详细介绍:输入层(Input Layer):接受输入的图像,并进行预处理。
2023-12-26 11:30:52
1012
原创 [DL]深度学习_ResNet
在神经网络中,"degradation"(退化)指的是当网络的深度增加时,性能反而下降的现象。具体来说,随着网络层数的增加,训练误差会逐渐减小,但验证误差却会先减小后增大,导致模型的性能退化。网络退化问题的原因有以下几点:梯度消失(Gradient Vanishing):在深层网络中,反向传播算法可能会导致梯度逐渐变小,使得参数更新很小或无法更新,从而降低网络的学习能力。
2023-12-19 21:40:51
1239
原创 [DL]深度学习_CNN卷积神经网络
在深度学习中,卷积是一种特殊的数学运算,它被广泛应用于卷积神经网络(Convolutional Neural Networks,CNNs)中。在卷积神经网络中,卷积主要是指对于输入张量(通常是图像或时间序列数据)的一种特殊的线性变换。卷积的定义在深度学习中稍有不同,具体来说,在卷积神经网络中,卷积操作是通过将一个可训练的小型过滤器(也称为卷积核或滤波器)应用于输入张量的不同位置来计算输出张量的过程。这个过滤器被滑动到输入张量的每个位置,并且在每个位置进行点乘和求和来计算一个输出值。
2023-12-12 17:36:36
1846
原创 [DL]深度学习_神经网络
神经网络前向传播(Feedforward Propagation)是指将输入数据在神经网络中进行计算的过程。在神经网络的每一层中,通过激活函数对输入进行转换,再将转换后的结果传递到下一层,直到达到输出层。在前向传播的过程中,每一层的权重和偏置都会被使用。整个前向传播的过程是一个单向的计算过程,没有反馈回来的信息。在每一层中,将输入数据乘上对应层的权重矩阵,再加上偏置向量。将该层的输出传递到下一层,重复步骤2-3,直到达到输出层。对每一层的结果使用激活函数进行转换,得到该层的输出。
2023-12-11 20:03:21
1999
原创 [DL]深度学习_基础
深度学习(Deep Learning)源于神经网络领域,是一种基于多层神经网络的机器学习方法。相较于传统的浅层神经网络,深度学习模型具有更高的神经网络层数,因此能够处理更为复杂的数据,包括图像、语音、自然语言等。深度学习的基本构建模块是神经网络,其基本思想是将大量数据输入到神经网络中进行训练,通过不断调整神经元之间的连接权重,学习到数据中的特征,然后用这些学习到的特征来进行预测和分类。神经网络中的每一个神经元都拥有权重和偏置,权重确定了神经元之间的连接强度,偏置则是用于调整神经元的输出值。
2023-12-08 11:15:58
846
原创 [ML]机器学习_强化学习
强化学习是一种从环境与智能体的交互中进行学习的机器学习方法。它的主要目标是通过智能体进行实验来获得关于环境和任务的信息,最终达到最优的决策策略。 在强化学习中,人们通常将环境描述为一系列状态和动作的集合。智能体的任务是选择一系列动作来改变环境的状态,并最大化长期的回报(通常用累计奖励的期望来表示)。智能体的决策策略通常基于学习算法得出并随时间推进而发生调整。 在强化学习中,有两种基本的方法:基于值函数的方法和基于策略的方法。 基于值函数的方法,比如Q-learning,通过学习环
2023-12-08 10:48:14
410
原创 [ML]机器学习_PCA主成分分析
主成分分析(PCA)是一种算法,可以获取大量特征的数据,并将特征数量减少到两三个特征(即二维或三维),以便对特征进行可视化绘图。如果有关于轿车集合的数据,轿车有许多的特征,如汽车长度,宽度,高度等。借助PCA减少特征数量以便将其特征可视化。1、假设特征是汽车的长度,是汽车的宽度,由于事实情况限制,汽车的宽度往往变化不会太大,如果有一个汽车集合中是汽车长度和宽度的数据集,则数据特征分布会如下图所示。其中特征车长变化很大,而特征车宽则变化相对较小。如果需要减少特征,则可以做的是取特征车长。
2023-12-07 17:31:12
1035
原创 [ML]机器学习_基于内容过滤的深度学习算法
基于内容过滤的深度学习算法是一种利用深度学习技术实现的推荐算法。它的主要思想是利用用户过去的行为和偏好以及物品的内容特征,通过深度学习模型来预测用户对物品的兴趣度,并向用户推荐可能感兴趣的物品。具体来说,基于内容过滤的深度学习算法一般分为以下几个步骤:特征提取:首先需要对物品的内容进行特征提取。这一步通常是使用卷积神经网络(CNN)或循环神经网络(RNN)等深度学习模型提取物品的视觉、文本、音频或其他内容特征。特征表示:将提取出的物品特征表示为向量形式。
2023-12-05 20:35:50
1231
原创 [ML]机器学习_协同过滤算法
协同过滤算法是一种推荐算法,其目的是为用户推荐他们可能感兴趣的物品。该算法使用用户的历史行为和偏好来预测他们对尚未查看或评分的物品的偏好。协同过滤算法有两种类型:基于用户和基于物品。基于用户的协同过滤算法根据用户之间的相似度来推荐物品。它首先计算用户之间的相似度,并根据这些相似度为每个用户推荐适合他们的物品。基于物品的协同过滤算法是相反的,它根据物品之间的相似度来推荐物品。协同过滤算法分为两种主要类型:基于用户的协同过滤和基于物品的协同过滤。
2023-11-26 19:28:12
1194
原创 定量遥感精度验证方法
公式:r = (Σ(反演值 - 反演值均值)×(实际值 - 实际值均值)) / sqrt(Σ(反演值 - 反演值均值)² × Σ(实际值 - 实际值均值)²)公式:R² = 1 - (Σ(反演值 - 实际值)² / Σ(实际值 - 实际值均值)²)模型检验法:将反演结果输入到模型中,与实际观测数据进行对比,验证模型的可靠性和精度。公式:Mean = (Σ(反演值 - 实际值))/ 样本数。最大值(Maximum)和最小值(Minimum):反演结果与实际值之间的最大差异和最小差异。
2023-11-15 19:54:14
1009
原创 [ML]机器学习_异常检测算法
异常检测是指在大量数据中检测出与其他数据不同的数据点或样本,通常被称为“异常值”或“离群值”。异常值可能是因为数据记录错误,或者是由于真实世界中的异常事件或问题导致的。异常检测是数据挖掘领域中的重要任务之一,它可以应用在许多领域,例如金融、医疗、电力、交通等。在金融领域,异常检测可以用来检测信用卡欺诈、洗钱等;在医疗领域,异常检测可以用来识别病人的异常病情,以及早期预警疾病的发生等。异常检测算法会查看未标记的正常数据集,从而学会检测异常事件或发出危险信号。
2023-11-06 21:04:17
242
原创 [ML]机器学习_聚类算法
聚类是一种机器学习和数据挖掘技术,它是将数据集中的数据对象分成不同的组或类的过程。它的目的是识别出数据集中相似的数据对象,并将它们分组。聚类算法通常基于两个基本假设:相似性和连续性。相似性假设认为属于同一组的数据对象应该具有相似的属性值。连续性假设认为属于同一组的数据对象应该彼此接近。聚类算法可以用于各种不同的领域,例如数据挖掘、生物学、图像处理和市场营销。聚类的结果可以用于确定数据集中的模式和结构,以及发现数据集中的异常值和离群点。
2023-11-05 10:07:13
568
原创 Python_列表、元组、字符串、集合、字典
Python中的列表是一种基本的数据结构,它允许我们以有序的方式存储一组数据,这些数据可以是任何类型的对象,例如整数、浮点数、字符串和其他更复杂的对象。以下是关于Python列表的详细介绍:1、创建列表:可以使用方括号[]或list()函数创建一个空的列表,也可以在方括号中添加元素创建一个非空的列表。2、访问列表元素:可以使用下标操作符[]或切片操作符[:]访问列表的元素或元素的子集。下标从0开始,-1表示最后一个元素。3、修改列表元素:可以使用下标操作符[]或切片操作符[:]修改列表的元素或元素的子集。
2023-10-29 15:45:12
56
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人