自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(83)
  • 收藏
  • 关注

原创 生成对抗网络(GANs)入门介绍指南:让AI学会“创造“的魔法(二)【深入版】

生成对抗网络(GANs)入门介绍指南:让AI学会“创造“的魔法(二)【深入版】

2025-06-15 17:37:33 603

原创 生成对抗网络(GANs)入门介绍指南:让AI学会“创造“的魔法(一)

小明(生成器)专门负责画假钞,他的目标是画得越来越像真钞,让人分辨不出真假小红(判别器)是个验钞专家,她的任务是识别哪些是真钞,哪些是假钞小明的造假技术越来越高超小红的识别能力也越来越强最终,小明能画出连小红都分辨不出的"假钞"这就是GANs的核心思想!两个神经网络在"对抗"中共同进步,最终生成器能产生以假乱真的数据。GANs为我们打开了一扇通向AI创造力的大门。从最初简单的手写数字生成,到今天能创作逼真艺术作品的强大系统,GANs的发展速度令人惊叹。

2025-06-15 17:32:51 614

原创 利用IS模型评估生成的图像质量

利用IS模型评估生成的图像质量

2025-06-12 21:43:02 171

原创 GAN+ECA注意力机制实现图像超分辨率重建

SRGAN融合ECA注意力机制,并讨论了去掉BN层的效果。

2025-06-12 21:05:16 106

原创 GAN模式奔溃的探讨论文综述(一)

介绍了一篇关于模式崩溃的综述,给大家借鉴一些研究方向。模式崩溃是GANs面临的一个重大挑战,主要由学习率不平衡、训练数据多样性不足、局部最优问题和标签数据不足等因素引起。为了解决这一问题,研究者们提出了多种策略,包括平衡训练动态、引入正则化技术、改进损失函数、使用经验重放机制和利用可解释性技术等。同时,未来的研究方向可以集中在混合模型、自动超参数优化、集成学习、强化学习和多模态生成等领域,以进一步提高GAN的性能和生成数据的多样性。

2025-06-06 22:44:25 306 1

原创 基于热力学熵增原理的EM-GAN

提出基于热力学熵增原理的EM-GAN,通过生成器熵最大化约束增强输出多样性。引入熵敏感激活函数与特征空间熵计算模块,在MNIST/CelebA等数据集上实现FID分数提升23.6%,有效缓解模式崩溃问题。

2025-05-31 15:00:00 227

原创 R3GAN利用配置好的Pytorch训练自己的数据集

这篇论文挑战了"GANs难以训练"的广泛观点,通过提出一个更稳定的损失函数和现代化的网络架构,构建了一个简洁而高效的GAN基线模型R3GAN。作者证明了通过合适的理论基础和架构设计,GANs可以稳定训练并达到优异性能。

2025-05-29 18:36:41 336

原创 R3GAN训练自己的数据集

这篇论文挑战了"GANs难以训练"的广泛观点,通过提出一个更稳定的损失函数和现代化的网络架构,构建了一个简洁而高效的GAN基线模型R3GAN。作者证明了通过合适的理论基础和架构设计,GANs可以稳定训练并达到优异性能。

2025-05-29 16:13:01 1186

原创 PSNR指标Pytorch实现

PSNR(Peak Signal-to-Noise Ratio,峰值信噪比) 是一个评估图像质量的重要指标,广泛用于衡量GAN生成图像与真实图像之间的相似度。

2025-05-26 11:14:19 194

原创 OpenGAN:基于开放数据生成的开放集识别

这次学习的OpenGAN主要学习一个思路,跳出传统GAN对于判断真假的识别到判断是已知种类还是未知种类。重点内容不在于代码而是思路,会简要给出一个设计的代码。

2025-05-26 10:42:39 3951

原创 GAN-STD:融合检测器与生成器的方法

通过浅层-深层特征对抗机制缩小目标表征差异,检测损失反向传播实现端到端优化,在检测器上构建GAN,实现小目标检测精度显著提升。

2025-05-25 15:00:00 55

原创 一种基于条件约束注意力生成对抗网络的水下图像增强模型

作者针对水下图像颜色失真、对比度低等问题,提出了一种基于条件约束注意力生成对抗网络的水下图像增强模型。对于生成器,主要通过U-Net架构,通过跳跃连接融合多尺度特征,并引入空间注意力模块(双路池化+残差连接)增强高频细节;对于判别器,通过条件对抗机制优化特征差异;组合损失函数融合对抗损失、MSE、L1及VGG内容损失,提升训练稳定性。

2025-05-18 19:50:16 182

原创 记录关于实现SCI低照度图像增强算法的部分报错问题。

记录关于实现SCI低照度图像增强算法的部分报错问题。

2025-05-16 15:52:22 229

原创 Mask-aware Pixel-Shuffle Down-Sampling (MPD) 下采样

这个代码实现了一个带有掩码感知的像素重排下采样模块,主要用于图像处理任务(如图像修复或分割)。本文通过设计实现了即插即用的模块设计。

2025-05-11 16:00:39 460

原创 HINT: High-quality INpainting Transformer with Mask-Aware Encoding and Enhanced Attention 训练自己的数据集

HINT(高质量图像修复变换器)通过创新的掩码感知像素洗牌下采样模块(MPD)和空间激活通道注意力层(SCAL),显著提高了图像修复的质量,尤其在大面积缺失区域的情况下。实验表明,HINT在CelebA、CelebA-HQ、Places2和敦煌数据集上超越了现有的最先进模型,提升了图像的细节和结构一致性。

2025-05-11 13:38:14 88 10

原创 一种基于条件生成对抗网络(cGAN)的CT重建算法

该文提出了一种基于条件生成对抗网络(cGAN)的CT重建算法,通过引入CBAM注意力机制增强网络对关键特征的提取能力,有效解决了CT成像中因噪声干扰导致的重建精度下降问题。实验采用固体火箭发动机模拟件数据集,将正弦图分为五组并添加不同程度的噪声进行训练。结果表明,与传统FBP算法相比,该方法在噪声增加时仍能保持高质量重建,显著提升了图像清晰度和精度。研究验证了cGAN结合注意力机制在CT重建中的优越性能,为工业CT图像处理提供了新的解决方案。

2025-05-06 20:17:36 217

原创 基于生成对抗网络的遥感图像去雾研究Pytorch代码复现

复现了一篇关于针对遥感图像受大气雾霾、尘埃等干扰导致图像模糊的问题的GAN模型结构用于训练自己的数据集。作者提出了一种基于生成对抗网络(GAN)的端到端去雾方法。该方法通过创新的生成器与判别器结构设计,结合多元损失函数,在定量指标(PSNR、SSIM)和主观视觉效果上均显著优于现有算法。

2025-04-30 18:21:43 55

原创 WGAN+U-Net架构实现图像修复

该论文提出了一种基于Wasserstein生成对抗网络(WGAN)的图像修复方法,结合U-Net生成器和条件判别器(CGAN),通过对抗损失与内容损失联合训练,有效解决了传统方法对破损区域形状大小受限、修复痕迹明显的问题。在CelebA和LFW数据集上的实验表明,该方法修复效果优于现有技术,尤其对大区域和不规则破损具有鲁棒性

2025-04-24 19:39:27 95

原创 Zero-DCE测试代码

原本的Zero-DCE的test代码不好用,分享以下自己改过的代码。

2025-04-18 23:57:31 206

原创 EnlightenGAN:低照度图像增强

记录如何使用EnlightenGAN来做低照度图像增强。该论文主要是提供了一个高效无监督的生成对抗网络,通过全球局部歧视器结构,一种自我调节的感知损失融合,以及注意机制来得到无需匹配的图像增强效果。

2025-04-18 23:54:00 135

原创 LLGAN:低光照图像增强方法

这篇论文提出了一种基于改进循环生成对抗网络(LLGAN)的无监督低光照图像增强方法。该方法通过多尺度残差块提取图像多尺度特征,采用特殊的StarConv卷积在低维空间学习非线性特征。同时引入特征聚合模块和混合空间通道注意力机制同时进行去噪和亮度增强,并利用LGAG门控机制减少信息丢失。通过全局-局部判别器结构减少图像细节丢失,有效解决了低光照图像中的噪声、色偏和细节模糊问题。

2025-04-15 13:54:34 78

原创 EPGAN:融合高效注意力的生成对抗网络图像修复算法

利用掩码设计来遮掉输入图像的一部分,将这类图像输入给生成器。生成器结合ECA注意力机制架构,利用感知损失、对抗损失和均方误差损失的加权和来作为生成器的损失计算。鉴别器分别对应掩码和整张图做损失计算。

2025-04-10 14:00:58 153

原创 Pytorch实现之利用深度残差GAN做运动图像的去模糊

采用类似U-Net的解码编码的结构,结合10层的残差连接结构作为生成器,改进PatchGAN得到更大的感受野来作为鉴别器。生成器的损失为内容损失,鉴别器的损失为WGAN-GP损失。大家可以尝试这个模型来解决运动图像的去模糊化。

2025-04-05 17:22:13 254

原创 Pytorch实现之基于GAN+序列后向选择的情绪识别增强方法

在WGAN-GP+CGAN的基础上利用了序列后向选择方法来挑选优质样本补充到训练集当中,丰富训练数据集。

2025-04-01 19:53:38 160

原创 注意力计算的形状尺寸记录

记录注意力机制的形状尺寸

2025-03-30 17:39:26 249

原创 Pytorch实现FSGAN实现少样本视网膜血管分割

提出了一种FS-GAN,通过U-Net网络对视网膜血管的少样本数据进行扩充。

2025-03-29 00:55:16 173

原创 开个坑记录一下树莓派4B部署yolo的一些问题

这个问题困扰了我一天半,下载的时候显示的信息是aar64的系统,但是这并无意味着一个问题,那就是你的操作系统是64位的。我在树莓派得出来的操作系统是32位。这就使得你在解压系统的时候会出现一些问题,比如conde.exe无法找到。

2025-03-25 23:28:05 439 4

原创 Pytorch实现之对称卷积神经网络结构实现超分辨率

针对传统的超分辨率重建技术所重建的图像过于光滑且缺乏细节的问题,作者提出了一种改进的生成对抗图像超分辨率网络。 该改进方法基于深度神经网络,其生成模型包含多层卷积模块和多层反卷积模块,其中在感知损失基础上增加了跳层连接和损失函数。 该判别模型由多层神经网络组成,其损失函数基于生成式对抗网络生成的判别模型损失函数。

2025-03-23 22:37:11 331 1

原创 CLIPstyle文生图风格迁移生成自己描述的风格图

CLIPstyle:通过文本修改转化为自己想要的风格图像

2025-03-18 12:56:41 87

原创 Pytorch实现之最小二乘梯度归一化设计

LSGAN提出了一种利用最小二乘法来计算两个数据分布之间的距离,该论文在此基础上采用梯度归一化来进一步稳定训练。

2025-03-15 13:44:25 154

原创 ECA注意力机制改进思路

ECA模块即插即用改进思路

2025-03-14 14:38:04 736

原创 Pytorch实现之BCGAN实现双生成器架构的人脸面部生成

通过双生成器架构与重建损失进行循环的生成训练,实现人脸面部表情合成。

2025-03-13 13:43:50 401

原创 Pytorch实现之利用普通GAN的人脸修复

利用遮挡真实样本的部分面貌,输入给生成器,让生成器输出未被遮挡的面貌,以达到修复人脸的效果。

2025-03-12 13:34:25 481

原创 记录一下VGG16的训练代码

【代码】记录一下VGG16的训练代码。

2025-03-11 23:11:40 113

原创 Pytorch实现之利用CGAN鉴别真假图像

利用CGAN来鉴别是真图像还是假图像。

2025-03-10 16:36:44 579

原创 (ECCV2018)CBAM改进思路

CBAM的代码改进思路

2025-03-09 14:09:14 970

原创 Pytorch实现之S2GAN实现Sentinel-2光谱波段的空间分辨率

提出了一种基于生成对抗网络的超分辨率(SR)方法(称为S2GAN)来提高Sentinel-2光谱波段的空间分辨率

2025-03-08 13:22:54 597

原创 (CVPR2024)InceptionNeXt_block改进思路

InceptionNeXt_block改进思路

2025-03-07 17:46:30 915

原创 Pytorch实现之SICSGAN实现图像识别

在改进的条件深度卷积生成对抗网络模型,利用频谱归一化的全局权重。 使用组归一化对隐层的输入进行处理,可以加快训练速度,提高生成样本的质量。 模型采用全局平均池化层代替全连接层,避免过拟合。同时设计了一个分类器,沿用鉴别器的参数来实现图像识别。

2025-03-07 16:36:10 219

原创 Pytorch实现之采用DCGAN并结合训练策略来生成狗狗图像

通过采用DCGAN来训练生成修狗的数据集,并且针对GAN网络在训练过程中经常遇到的一些问题做了一个总结,并且给出了七个策略来帮助训练。

2025-03-06 20:25:44 243

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除