weixin_50270824-优快云博客

原创 9.13 周三

概述：论文的不清晰名词解释，事件照相机，曝光时间导致的运动模糊，频率信息对于去模糊领域的优点事件照相机曝光时间过长在视频拍摄过程，由于相机曝光时间长，就会导致物体运动模糊传统的图像传感器，如我们常见的相机和手机摄像头中的传感器，它们在捕捉图像时依赖于一个固定的曝光时间。曝光时间是指传感器暴露于光线以积累足够的光子信息来形成图像的时间段。这个过程中，如果场景中的物体或相机本身在移动，那么这些运动信息就会在曝光期间被累积并重叠到同一帧图像中。

2024-09-23 20:36:38 1045

原创 151515

因此，在事件相机处理图片的过程中，当进行下采样时，虽然hw（图像的宽度和高度）变小了，但比例因子s（表示下采样比率的变量）的增大实际上反映了我们选择了更大的缩减比率。引入比例因子s是为了提供灵活性、标准化和计算效率。比例因子s与图像大小之间有直接的关系。在图像处理中，图像大小通常指的是图像的宽度（w）和高度（h）所定义的尺寸。比例因子s则是一个用于描述图像尺寸变化比率的参数。具体来说，当对图像进行下采样时，比例因子s决定了原始图像如何被缩减到更小的尺寸。

2024-09-16 19:37:42 443

原创 29 论文选择

Bilinear Sampling 是一种常见的图像处理技术，尤其在计算机视觉领域中的深度学习任务中，广泛应用于图像的变换与插值。具体来说，**Bilinear Sampling** 是双线性插值（bilinear interpolation）的一种应用，用来计算目标位置像素的值，特别是在对图像进行非整数位置的采样时。假设我们要从原图中采样一个新的像素，该像素的位置可能不精确地落在原图的整数像素位置上，这时我们就需要通过周围的四个像素值进行插值，来估算出该位置的像素值。

2024-09-13 16:27:05 357

原创对应19运行问题保存数据集地址

配置文件应该就是设置一些路径参数把训练过程：找到训练入口（应该都是main文件把），先读取模型在加载权重后，通常会调用将模型设置为推理模式（evaluation mode），或者根据情况调用将模型设置为训练模式。模型训练过程是机器学习和深度学习中的核心环节，它涉及一系列有序的步骤，以确保模型能够有效地从数据中学习并做出准确的预测。这些步骤构成了模型训练的基本流程，但在实际应用中，可能还需要根据具体问题和数据集的特点进行适当的调整和扩展。24.9.2保存。

2024-09-04 13:09:20 696

原创 9.2运行问题

这个错报了以后就是把那一行注释掉了。等train的时候再打开。这个的解决方法就是再第八行transforms.后面加了_这个显示retrying 连不上组里服务器网络。

2024-09-02 18:53:44 172

原创【无标题】

瓶颈结构指的是一种网络模块或设计，其中“瓶颈”一词形象地描述了网络中最窄的部分，即在该部分，特征图的通道数或维度被显著减少。这种设计通过引入一个或多个特殊的卷积层来实现，这些卷积层在减少特征图维度的同时，尽可能保留有用的信息，以便在后续层中恢复或进一步增强这些信息。

2024-09-01 19:24:00 1262

原创 778811

我们发现现有的视觉状态空间模型大多采用多次固定方向扫描进行特征提取，这种方法可能无法自适应地探索非局部信息，导致较高的计算成本，因此我们开发了一种简单而有效的扫描策略，在保持低计算成本的同时捕获非局部空间信息。具体来说，我们只在一个方向上扫描输入特征，但在每次扫描之前使用简单的几何变换，在最小的计算成本增加的情况下有效地自适应地探索有用的信息。【learning得那个】最近，结构化状态空间序列模型（S4），特别是改进版Mamba，已经成为构建深度网络的高效和有效的骨干[17，19，21，46，55]。

2024-08-30 15:53:33 247

原创基于深度残差先验的不确定性感知无监督图像去模糊?

数据驱动先验过于依赖于训练数据的多样性和丰富性，容易产生偏离分布的模糊和图像。为了解决这一挑战，我们提出了一个由定制的未经训练的深度神经网络表示的核诱导误差(称为残差)的无数据集深度残差先验，这使我们能够灵活地适应真实场景中不同的模糊和图像。通过有机地整合深度先验和手工先验的各自优势，提出了一种从模糊图像和不准确的模糊核中恢复清晰图像的无监督半盲去模糊模型。在本文中，我们提出了一个由定制的未经训练的深度神经网络表示的残差的无数据集深度先验，使我们能够灵活地适应真实场景中不同的模糊和图像。

2024-07-29 21:14:36 265 2

原创 26学习小记

输入图片和输出图的高宽没有变的情况下，通常是不会改变通道数的；如果输出图片和输入的高宽都减半的话，输出的通道数会加一倍（空间信息压缩，把提取的信息在更多通道中存起来）对于输入的通道来说，每个通道对应的二维卷积核是不一样的，对于输出的通道来说，每个通道对应的三维卷积和是一样的。每个通道的卷积核是不一样的，不同通道的卷积核大小是一样的，应该少说了大小两个字把？每个通道的卷积核的权重是不一样的，不同通道的卷积核大小是一样的。输入通道数=每个核的通道数，输出通道数=卷积核的个数。核的参数是学出来的（不是选的）

2024-07-26 20:17:34 316

原创 25学习小记

在回归任务中，L1损失函数计算的是预测值与真实值之间绝对误差的总和。对于单个样本，其定义为：L1(预测值,真实值)=∣预测值−真实值∣在机器学习模型的训练过程中，整个训练集的L1损失是所有样本L1损失的平均值或总和，具体取决于实现。使用L1损失函数的一个主要优点是它对于异常值（outliers）的鲁棒性较强，因为绝对误差的增长与误差的绝对值成正比，而不像平方误差那样增长得更快。L1损失函数也常用于正则化技术中，特别是在线性回归或逻辑回归等模型的训练中，通过向损失函数中添加模型参数的L1。

2024-07-26 14:40:03 1326

原创 Deep Image Deblurring: A Survey

本文对最近发表的基于深度学习的图像去模糊方法进行了全面而及时的调查，旨在为社区提供有用的文献综述。我们首先讨论图像模糊的常见原因，介绍基准数据集和性能指标，并总结不同的问题公式。接下来，我们根据结构、损失函数和应用对卷积神经网络(CNN)的方法进行了分类，并进行了详细的回顾和比较。此外，我们还讨论了一些特定领域的去模糊应用，包括人脸图像、文本和立体图像对。最后，我们讨论了主要挑战和未来的研究方向。图像去模糊是底层计算机视觉中的经典任务，已经引起了图像处理和计算机视觉界的关注。

2024-07-25 14:54:09 516

原创 24运行中的问题

Iter_step（迭代步）：每次更新模型参数所需的单个训练步骤。通常，每执行一次前向和后向传播并更新模型参数就称为一个迭代步。Epoch（时期）：训练集中的所有样本经过一次完整的前向和后向传播过程。即，所有的训练数据通过模型一次，称为一个时期。感知损失通过在特征空间中计算图像的差异，更好地捕捉图像的高层次语义和结构信息，是提高图像生成和图像处理任务中视觉质量的重要工具。在实际应用中，感知损失通常与其他损失函数（如像素级损失、对抗损失）结合使用，以获得更好的结果。

2024-07-24 21:47:24 2134

原创 22学习小记

如果配置文件里面实验名称里有 debug ，就是 debug 模式。

2024-07-22 21:09:06 189

原创 21学习小记

函数对于多态性（polymorphism）和类型安全（type safety）的编程实践非常有用，尤其是在需要确保对象类型符合特定要求时。是 PyTorch 中的一个类，用于在多个 GPU 上并行地执行模型的前向和反向传播，以加速训练过程。函数是Python的内置函数，用于判断一个对象是否是一个已知的类型，类似类型判断。文件名包含了当前的迭代步数和训练周期，以便于区分不同的保存点。通过这种命名方式，可以很容易地识别每个保存文件对应的具体迭代步数和训练周期。某个类（或类型）的实例的条件语句的一部分。

2024-07-21 21:13:31 330

原创 Efficient Frequency Domain-based Transformersfor High-Quality Image Deblurring

过拟合是指模型在训练数据上表现良好，但在测试数据上表现较差的情况，其主要原因是模型过度拟合了训练数据的噪声和特异性（以至于在测试时，稍微与训练数据的“特异性”不同，模型就认为它不是我们寻求的目标，让模型失去了泛化能力）。，通过元素积运算来估计缩放后的点积注意，而不是在空间域中的矩阵乘法。为了克服这个问题，我们提出了一种简单而有效的基于鉴别频域的FFN (DFFN)，其中我们在FFN中引入了一种基于联合摄影专家组(JPEG)压缩算法的门控机制，以判别应该保留哪些低频和高频特征信息以进行潜在的清晰图像恢复。

2024-07-19 10:31:30 2096

weixin_50270824的博客