自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 CVPR2023_Guiding Pseudo-labels with Uncertainty Estimation for Source-free Unsupervised Domain论文阅读_7

本文的思想认为,一个网络的预测,随着网络的训练过程是会改变了,其在过去T个时间内,总有一次是预测正确的,应此,本文对于负样本对的排除提供了改进方法,主要两个网络的预测结果中,在过去时间T内,有任意一个结果与另一网络过去T时间内结果相同,即将该目标排除在负样本对以外。方法利用求取到的伪标签进行损失函数的计算,但是求取到的伪标签具有一定的不准确性,传统方法对所有的结果取相同的损失权重,但是本文针对此问题进行了优化。为此,仅需要对熵值较低的目标设置较高的损失权重,而对于熵值是较高的目标设置较低的损失权重。

2023-09-30 19:41:16 445 1

原创 CVPR2023_Zero-shot Generative Model Adaptation via Image-specific Prompt Learning 论文阅读记录_6

对于缺乏先验知识的目标域而言,其可以贡献原域与目标域学习到的Prompt,但是这样会导致一个问题,即有些在原始域中适合的属性,但是在目标域中不那么适合,即对于“Human”域 “round ear”属性是合适的,但是对于“Tolkien elf”是较为不合适的。本文是个根据StyleGAN-NADA进行改进,以往的方法通过人为设置Prompt,其对于多张图像存在相同的Prompt,而所提出的方法,可针对不同图像设置了不同的Prompt。,Vm},然后在结合一个域标签Y_s生成最终的Prompt M_i。

2023-09-29 23:54:17 404 1

原创 ECCV2022_Efficient and Degradation-Adaptive Network for Real-World Image Super-Resolution论文阅读记录_5

方法首先预先定义大量的下采样策略,利用下采样策略来尽量拟合真实下采样效果,下采样方法用V表示,输入高清图像Y首先利用V进行下采样处理生成x,之后将x输入到P网络中,对下采样方法V进行预测,生成v_,之后在将v_输入到A中生成,预测生成参数权重a,网络引入了专家网络的思想,其包含多个子网络,其中子网络具有相同的网络结构(作者的思想是:每个子网络对应一种下采样方法,这样是的方法是术业有专攻,可以针对不同的缺陷一对一解决),而获得的参数权重a则是用来选择哪个子网络进行解决。

2023-09-28 21:51:28 278 1

原创 TMM22_Real-World Image Super-Resolution by Exclusionary Dual-Learning_论文阅读记录

方法首先利用滑动窗口的思想,对所有图像进行分块,然后分别计算每一个图像块的均值与方差,然后对其进行排序,从大到小,选取其数值排在最后2%的块,记录分界线为Th,当作噪声池。此外,后2%的图像区域平滑,作者认为噪声会在光滑图像上给予凸显,而那些具有较多纹理的图像,由于其中包含大量的纹理信息,其纹理信息可能会掩盖掉其中的噪声。另外一个问题就是,感觉不能这样直接提取噪声图像,我认为复杂场景的噪声不会被掩盖把,而且和少纹理的图像块,可能具有不同的噪声分布?只不过最终的网络输入LR图像还为加上刚才提取的噪声。

2023-09-25 20:33:42 176 1

原创 CVPR2023_Guided Depth Super-Resolution by Deep Anisotropic Diffusion 论文阅读记录_4

网络模型的上下文推理能力可以增强扩散模型的边缘增强特性。调整步骤使得生成的图像与原始图像类似。

2023-09-12 22:22:57 355 1

原创 ICCV2023_Spatially-Adaptive Feature Modulation for Efficient Image Super-Resolution 论文阅读记录_3

SAFM网络的整体结构图如下图的左小图所示,其首先在通道维度对输入的特征进行拆分,拆分成4小份,然后再分别传入adaptive-maxpooling 层中,其中下采样层具有不同的下采样率,分别为0,2,4,8。CCM的架构如上图的右部分,就是由一个3X3、1X1的卷积和一个GELU激活层构成,其中3X3首先将输入的特征通道上升到两倍,之后1X1卷积再将特征通道下降到与输入相同。其中每个FMM模块由一个SAFM与CCM模块构成,即本文的创新点所在。去掉SAFM的影响以及去掉CCM的影响。

2023-09-11 10:27:19 815 1

原创 CVPR2022_Learning Graph Regularisation for Guided Super-Resolution论文阅读记录_2

这篇文章主要是设计了一个正则化项,使得网络的超分辨率效果更好(即超分的结果更为平滑)。

2023-09-10 21:30:43 209 1

原创 CVPR2023_N-Gram in Swin Transformers for Efficient Lightweight Image Super-Resolution 论文阅读记录_1

N-Gram的概念已经出现在语言模型中,其主要就是将目标词语的前后词语当作辅助信息输入即可。而图像中的N-Gram概念与其类似。问题A:如图二的h所示,红色方框的特征与邻居特征具有较为明显的不同,从而导致(e)红色方框中出现了失真现象。问题B:如图(f、g),红色方框与邻居方框色彩有着较为明显的不同,说明网络在推理时没有利用到邻居特征。3. 利用一个卷积网络将Forward-Gram与Backward-Gram进行融合。4. 将融合后的Gram作为偏置项添加到原始输入的特征中。引入N-Gram的消融实验。

2023-09-09 16:07:28 1368 1

原创 基于深度学习的上采样方法

常见的基于深度学习的上采样方法。

2023-08-30 18:12:41 364 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除