
论文学习
文章平均质量分 96
本专栏旨在记录学习的论文,以方便需要学习该论文的小伙伴。
东荷新绿
东池始有荷新绿,尚小如钱。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【NeurIPS-2022】CodeFormer: 将人脸复原转化为码本预测以减少LQ-HQ映射的不确定性
盲人脸恢复是一个高度不适定的问题,通常需要辅助指导,各种先验已经被用来减轻这个问题的不适定性,包括几何先验,参考先验和生成先验。LQ-HQ映射不确定性仍然存在,并且输出质量因输入图像的退化而恶化。一些基于生成先验方法,通过迭代优化或直接潜在编码将退化的人脸投影到连续的无限空间中。在严重退化的情况下,很难找到准确的潜在向量,导致低保真度的结果。进而将盲人脸恢复作为代码预测任务可大大降低恢复映射的不确定性和模糊性,同时提供丰富的视觉原子来生成高质量的人脸。原创 2025-03-18 21:08:31 · 1123 阅读 · 0 评论 -
【CVPR-2023】DR2:解决盲人脸复原无法覆盖真实世界所有退化的问题
盲人脸复原通常将退化的低质量数据与预定义的退化模型进行训练,不足以囊括真实世界中的更复杂的退化场景;因此在复原真实退化时候经常观察到伪影。同时,构建训练集以覆盖真实世界的各种退化是不可能的。本文为了解决这个问题,提出了一种两阶段的复原方法即基于扩散的鲁棒退化去除器(DR2),先将退化图像转换为粗糙但退化不变的预测,然后使用增强模块将粗糙预测恢复为高质量图像,使得DR2对常见的退化具有鲁棒性(例如模糊,调整大小,噪音和压缩)和兼容不同的设计增强模块。原创 2025-03-16 20:40:40 · 925 阅读 · 0 评论 -
【论文学习】RVS-FDSC:一种基于四方向条带卷积的视网膜血管分割方法以增强特征提取
RVS-FDSC在保留传统U-Net优势的同时,通过残差条纹卷积模块(RSC)、多尺度特征融合技术(MSPF2)和残差并行双注意力(RPDA)模块显著提升了对视网膜血管特征的捕捉能力。实验结果表明,与传统方法相比,所提出的方法在分割精度上具有显著提升。未来可以进一步研究其在其他医学图像分割任务中的应用。原创 2025-02-19 23:22:54 · 1287 阅读 · 0 评论 -
【回首U-Net】:类U-Net网络结构中具潜力的创新与调整
U-Net作为一种经典的神经网络模型,在生物医学图像分割领域取得了卓越成就。其对称的编码器-解码器结构、卓越的性能优势以及广泛的实际应用,使得U-Net成为深度学习技术在图像分割领域的重要里程碑。但在实际的类U-Net网络中是否一成不变的沿用其结构,这值得思索,诸如通道数量的调整和特征融合的方式等,往往需要不断的尝试和实验。原创 2025-02-17 20:44:09 · 742 阅读 · 0 评论 -
【TPAMI-2024】EfficientTrain++帮你降低网络训练的成本
该出了一种新的广义课程学习方法EfficientTrain++,总是利用每个学习阶段的所有数据,但只在训练开始时暴露每个示例的“容易学习”模式(例如,在数据增强之前,图像和原始信息的低频成分),并随着学习的进展逐渐引入更困难的模式。为了设计一个合适的课程学习计划,提出了一个定制的计算约束的顺序搜索算法,产生一个简单的,良好的泛化,但惊人的有效的训练课程。原创 2024-06-04 14:53:00 · 1231 阅读 · 0 评论 -
【CVPR_2024】:逐元素乘积为什么会产生如此令人满意的结果?
该论文则是通过明确地证明星型运算具有将输入映射到一个非常高维的非线性特征空间的能力,来解释星型运算的强代表性能力。- 揭示了星形运算具有将特征投射到极高维隐式特征空间的能力- 通过实证结果和理论探索来验证分析以及视觉表现- 提出StarNet,超越了许多高效的设计。- 该论文的分析可作为一个指导框架,引导研究人员进行的络设计。原创 2024-06-01 17:26:02 · 2227 阅读 · 0 评论 -
你的轻量化设计能有效提高模型的推理速度吗?
轻量化网络是指在保持较高性能的同时大大减少模型参数和计算量的神经网络模型。轻量化网络的出现是为了解决在移动设备和嵌入式系统等资源受限的环境中部署深度学习模型时所面临的挑战。传统的深度学习模型通常包含大量的参数和复杂的计算结构,这使得它们在移动设备上运行时需要消耗大量的内存和计算资源。而轻量化网络通过精心设计结构和参数,可以在移动端实现更加高效的部署,从而适应移动设备上的应用需求。因此轻量化网络的研究和发展是深度学习领域的一个重要方向,涉及网络结构设计、模型压缩、量化技术、剪枝等多个方面。原创 2023-12-07 15:08:27 · 1526 阅读 · 0 评论 -
正则化与正则剪枝
正则化是一种在机器学习中用于控制模型复杂度的技术,它通过在损失函数中添加一个额外项来对参数进行约束,从而避免过拟合。其中,L1正则化通过对参数的绝对值求和来实现,能够产生稀疏权重;L2正则化通过对参数的平方和求根号来实现,能够产生较为平滑的权重;实际上可以结合两者来共同约束参数。在实际应用中,正则化可以帮助模型更好地泛化数据,提高模型的鲁棒性和可靠性。同时,正则化也需要根据具体问题进行调整,不同的正则化方法和系数可能会产生不同的效果。原创 2023-11-26 21:58:01 · 1539 阅读 · 0 评论 -
MobileNets发展与总结
MobileNet是一种轻量级的深度卷积神经网络(CNN),旨在在计算资源有限的移动设备上实现高效的图像分类和目标检测。MobileNet的设计出发点是通过减少模型参数和计算量来提高模型的速度和效率,同时尽可能保持模型的准确性。MobileNet首先引入了深度可分离卷积(Depthwise Separable Convolution)结构。随后MobileNet后续由一系列的Inverted Residual Blocks组成。原创 2023-11-25 14:15:07 · 1180 阅读 · 0 评论 -
【论文学习】PromptIR:一种基于提示学习的一体化图像恢复方法
PromptIR:一种基于提示学习的方法来执行一体化图像恢复。具有以下的特点①完全依赖于输入图像来恢复干净的图像,而不需要任何退化的先验知识。②很容易地集成到任何现有的恢复网络。。③具有动态适应能力原创 2023-07-20 11:28:27 · 2889 阅读 · 11 评论 -
【论文学习】RAHC:一种处理五种常见天气的任意混合退化的图像修复方法
RAHC通过AdverseGAN学习隐式退化提供成对的训练数据,使用三种量身定制的设计结构,以一次性恢复任意混合恶劣天气条件(图1(d)),具有下列特点:①多天气退化表示的多头混合块(MHBB):覆盖卷积和注意混合算子的多头机制可以为混合多天气学习提供多个“表示子空间”以及互补特征。②用于图像成分保留有限的混合条件下的重建向量辅助恢复(RVA):在大规模自然图像上预训练的Codebook中封装的离散表示(重建向量),可以提供额外的视觉内容线索,以辅助重建真实而清晰的输出。③高效任意混合条件恢复原创 2023-07-18 14:56:30 · 1325 阅读 · 2 评论 -
【论文学习】DifFace:一个建立在后验分布上的鲁棒扩散模型
DifFace是这么一个通过建立低质量(LQ)图像到高质量(HQ)图像的后验分布,以生成具有清晰面部形状和逼真面部细节的图像,具有下列特点:①后验分布:从LQ图像开始到理想HQ图像结束的马尔可夫链。②在反向扩散过程中部分构建马尔可夫链以利用在预训练扩散模型中捕获的图像。③没有复杂损失,只需要训练一个具有L2损失的神经网络,简化了训练。原创 2023-07-16 14:07:53 · 784 阅读 · 0 评论 -
【论文学习】Panini-Net:一种可根据退化程度动态融合特征复原方法
Panini-Net通过无监督退化表示学习策略来提取退化图像的判别退化表示,并作为动态融合的全局条件,以生成具有清晰面部形状和逼真面部细节的图像,具有下列特点:①化感知特征插值(DAFI)模块。②无监督退化表示学习策略。③特征提取模块。原创 2023-07-15 21:47:17 · 526 阅读 · 0 评论 -
【论文学习】PSFR-GAN:一种结合几何先验的渐进式复原网络
PSFR-GAN将结合几何先验,以生成具有清晰面部形状和逼真面部细节的图像。①通过FPN为LQ输入生成解析映射②以多尺度LQ图像和解析图为输入,通过语义感知风格变换,逐步恢复高质量的人脸细节。③引入语义感知风格损失,有助于提高不同语义区域的纹理恢复,减少伪影的发生。原创 2023-07-14 13:50:06 · 462 阅读 · 0 评论 -
【论文学习】GCFSR:一种无需先验的强度可调的人脸超分框架
GCFSR有下列优势:①生成强度可以交互调节。②样式调制和特征调制模块。③GCFSR具有良好的训练性能,端到端可训练的,收敛速度快。原创 2023-07-13 17:20:40 · 514 阅读 · 1 评论 -
【论文学习】SGPN:一种形状和生成先验相结合盲脸复原的方法
SGPN包含下列内容:①网络包含形状恢复模块和与生成先验模块;②自适应特征融合块作为基本生成GAN块;③图像级重建损失Lrec和对抗损失Ladv被用来增强图像的保真度和真实感;④网格级三维地标损失L3dlm和网格损失Lmesh被用来增强形状恢复。原创 2023-07-13 15:53:59 · 560 阅读 · 1 评论