优质生成模型训练自己的数据集
文章平均质量分 82
利用Pytorch复现完整的GAN、扩散等生成模型框架,并可以直接用于训练自己的数据集。
余额抵扣
助学金抵扣
还需支付
¥79.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
这张生成的图像能检测吗
方向:机器视觉,主攻目标检测、GAN图像生成、低照度图像处理、模型三维结构设计、单片机开发板控制。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
权重生成图像
利用训练好的权重文件生成图像原创 2025-02-27 23:05:12 · 402 阅读 · 0 评论
-
优质GAN模型专栏目录
生成模型,通常用于生成逼真的数据(如图像、视频、音频等)。特别是生成模型,GANs、DDPM等在多个领域中得到了广泛的应用,且其优点也使得它在很多场景中表现出色。包括生成高质量数据、无监督学习、数据增强、灵活性和适应性、高效的表示学习、创新的生成能力、对抗训练的鲁棒性该专栏主要利用Pytorch框架复现关于图像生成模型系列论文代码。原创 2025-02-23 10:00:00 · 676 阅读 · 0 评论
-
Pytorch实现之ISRGAN高分辨率图像生成训练自己的低分辨率图像
结合了深层次的残差结构的改进SRGAN模型。在低尺寸图像上执行SR,以使图像重新尺寸重新尺寸时增强和恢复图像的细节更细节更大的尺寸。原创 2025-02-20 23:33:44 · 591 阅读 · 0 评论
-
Pytorch实现之SCGAN实现人脸修复
深度学习在涉及人脸修复的工作中得到了广泛的应用,然而,通常会出现一些问题,如不连贯的修复边缘、生成图像缺乏多样性等问题。为了获得更多的特征信息,提高修复效果,我们提出了一种跳过连接生成对抗网络(SCGAN),该网络通过跳过连接在生成器中连接编码器层和解码器层。同时使用判别器的局部和全局双判别器模型,提高了图像修复边缘的连贯性和一致性,并细化了图像修复的更精细特征。我们还采用WGAN-GP损失来增强模型在训练过程中的稳定性,防止模型崩溃,并增加修复人脸图像的种类。原创 2025-02-18 22:38:23 · 477 阅读 · 3 评论
-
Pytorch实现论文:对GAN的交替优化
Pytorch实现论文:对GAN的交替优化应用在ACGAN上的效果测试。原创 2025-01-24 21:27:38 · 848 阅读 · 0 评论
-
ShortDF模型训练自己的数据集指南
ShortDF(最短路径扩散模型),一种基于图论优化的去噪扩散模型。该模型通过将去噪过程建模为最短路径问题,显著提高了生成效率和质量。实验显示,ShortDF在CIFAR-10和CelebA等数据集上,仅需2-10步即可达到优于传统DDIM(100步)的效果,FID指标提升18.5%-52.8%。文章详细提供了从环境配置、数据集准备到训练优化的完整指南,包括常见问题解决方案和不同分辨率下的参数配置建议。源代码已开源,支持自定义数据集训练,为快速高质量图像生成提供了新思路。原创 2025-12-31 14:11:08 · 27 阅读 · 0 评论 -
(训练自己的数据集指南)ECCV2024:Nickel and Diming Your GAN:通过知识蒸馏提高GAN效率的双重方法
(训练自己的数据集)ECCV2024:Nickel and Diming Your GAN:通过知识蒸馏提高GAN效率的双重方法原创 2025-12-15 00:25:31 · 245 阅读 · 1 评论 -
Fast-DDPM训练自己的数据集(医学图像转换、超分和去噪)
Fast-DDPM训练自己的数据集指南(医学图像转换、超分和去噪)原创 2025-12-01 00:02:30 · 68 阅读 · 0 评论 -
(综述)工业表面缺陷图像生成技术综述
本文综述了工业表面缺陷图像生成技术的研究进展。针对工业场景中缺陷样本稀缺、多样性不足的问题,系统梳理了传统CAD方法、图像处理方法及深度学习方法(GAN、扩散模型等)的优缺点。重点分析了扩散模型在工业缺陷生成中的创新应用,包括Stable Diffusion微调、LoRA高效训练和ControlNet精确控制。实验表明,扩散模型在生成质量、多样性和小样本适应性上显著优于传统方法,能提升下游检测任务准确率12.73%。文章还探讨了领域面临的挑战,如小样本学习、评估体系完善等,并提出了未来研究方向。为工业质检提原创 2025-11-24 15:52:04 · 518 阅读 · 0 评论 -
CoDeGAN:用对比学习重新定义GAN中的表示解耦
本文提出了一种名为CoDeGAN(对比解纠缠生成对抗网络)的新方法,用于解决GAN模型中的表示解耦问题。传统方法如InfoGAN通过最大化生成图像与潜在代码间的互信息来实现解耦,但容易导致模式崩溃和生成多样性降低。CoDeGAN的创新点在于将相似性约束从图像域转移到特征域,并结合自监督预训练来学习语义表示。该方法包含三个关键组件:生成器、判别器和编码器网络,并设计了一种新的对比损失函数来优化特征级别的解耦性能。实验结果表明,CoDeGAN在多个基准数据集上优于现有方法,在CIFAR-10上的分类准确率比In原创 2025-11-03 20:00:17 · 204 阅读 · 0 评论 -
CLR-GAN训练自己的数据集
详细介绍CLR-GAN的技术方法,通过引入一致的潜在表示和重建机制改进GAN训练稳定性,并指导如何训练自己的数据集。原创 2025-09-17 14:51:29 · 183 阅读 · 0 评论 -
CAGAN训练自定义数据集完整教程
CA-GAN文本到图像生成方法,通过三个关键创新有效提升了生成质量:1)Context-Aware Block(CA-Block)实现文本与图像特征的深度语义融合;2)Attention Convolution Module(ACM)增强特征表达能力;3)混合自注意力与卷积的判别器架构。实验表明该方法在语义一致性和图像细节方面优于现有技术。文章还详细介绍了针对工业缺陷检测等专业领域的模型适配方案,包括数据准备、核心代码修改和训练流程优化原创 2025-09-12 13:04:07 · 503 阅读 · 0 评论 -
残差去噪扩散模型
CVPR 2024论文《残差去噪扩散模型(RDDM)》提出创新性双重扩散框架,将传统扩散过程解耦为残差扩散和噪声扩散两个独立过程。该模型通过残差项明确表示图像退化方向,增强了图像恢复任务的可解释性,同时保留噪声扩散的生成能力。实验表明,RDDM使用简单UNet架构和L1损失,在图像生成和多种恢复任务(去阴影、低光增强等)上均取得具有竞争力的效果。模型支持部分路径独立的采样过程,允许灵活调整扩散系数,并提供开源代码供进一步研究。原创 2025-09-06 16:13:51 · 417 阅读 · 0 评论 -
3D生成模型-NeRF:用神经辐射场定义视图合成
NeRF(神经辐射场)重建自己的三维视图。原创 2025-08-30 08:32:12 · 156 阅读 · 0 评论 -
RandAR训练自己的数据集
RandAR:随机顺序下仅解码器的自回归视觉生成。一种突破性的仅解码器自回归视觉生成模型,能够以任意顺序生成图像。通过引入位置指令标记和随机排列训练策略,RandAR消除了传统模型对预定义生成顺序的依赖,实现了更灵活的视觉生成。该方法在保持与传统光栅顺序相当生成质量的同时,解锁了多项新能力:2.5倍加速的KV-Cache并行解码、零样本图像修复与绘制、分辨率外推等。实验表明,RandAR为解码器视觉生成模型开辟了新方向,显著拓宽了应用场景。原创 2025-08-24 23:02:25 · 226 阅读 · 0 评论 -
DTPM:基于扩散模型的图像恢复方法
在计算机视觉领域,图像修复一直是一个充满挑战的任务。无论是去除图像中的雨滴、雾霾,还是修复模糊的照片,传统方法往往能够恢复图像的大致轮廓,但在细节纹理的重建上却常常显得力不从心。今天我们来介绍一项突破性的研究:Diffusion Texture Prior Model (DTPM),它巧妙地将扩散模型的生成能力专门用于纹理恢复,为图像修复带来了革命性的改进。原创 2025-08-15 13:37:17 · 219 阅读 · 0 评论 -
SOMGAN:用自组织映射改善GAN的模式探索能力
利用自组织映射提高生成对抗网络的模式探索能力原创 2025-08-07 14:53:05 · 106 阅读 · 0 评论 -
图像生成指标:CMMD
CVPR 2024提出的CMMD(CLIP Maximum Mean Discrepancy)是一种新型图像生成质量评估指标,旨在解决传统FID(Fréchet Inception Distance)的核心缺陷。CMMD采用CLIP的跨模态特征表示(相比FID的Inception-v3特征),结合无需分布假设的MMD距离度量,具有四大优势:(1) 更强的特征表示能力,支持复杂场景评估;(2) 无偏估计且不依赖正态分布假设;(3) 样本效率提升4倍(仅需5000样本);(4) 计算速度比FID快100原创 2025-08-02 01:06:04 · 227 阅读 · 0 评论 -
DDPM:重新定义图像生成的革命性技术
去噪扩散概率模型(Denoising Diffusion Probabilistic Models, DDPM)是近年来最具突破性的生成模型之一。本文将深入探讨DDPM的理论基础、数学原理,并通过完整的PyTorch实现,带你从零开始理解这一改变AI图像生成格局的技术。原创 2025-07-27 17:04:44 · 131 阅读 · 0 评论 -
(综述论文)扩散模型的设计基础综述分析
扩散模型-基础结构设计综述论文介绍原创 2025-07-23 19:34:07 · 83 阅读 · 0 评论 -
文生图-StoryGAN:用于故事可视化的顺序条件GAN
很多生成的图像问题都是基于一句话来描述的,想让下一句话的描述在上一个场景中延续,怎么办呢?于是就有了作者的做一篇StroyGAN!原创 2025-07-19 15:18:48 · 467 阅读 · 0 评论 -
EWSGAN:自动搜索高性能的GAN生成器架构
EWSGAN:旨在自动搜索高性能的GAN生成器架构,解决手工设计GAN架构需要大量专业知识和试错的问题。原创 2025-07-13 21:54:17 · 144 阅读 · 0 评论 -
SPGAN: Siamese projection Generative Adversarial Networks
该论文针对传统GANs中鉴别器采用硬边际分类导致的误分类问题,提出了基于Siamese projection网络的SPGAN方法。主要创新点包括:(1)设计Siamese projection网络来测量特征相似性;(2)提出相似特征对抗学习框架,将相似性测量融入生成器和鉴别器的损失函数;(3)通过相似特征对抗学习,鉴别器能最大化真实图像和生成图像特征的差异性,生成器能合成包含更多真实图像特征的图像原创 2025-07-10 19:56:11 · 119 阅读 · 0 评论 -
CHAIN(GAN的一种)训练自己的数据集
作者针对数据有限场景下GANs训练中的判别器过拟合问题,提出了CHAIN(Lipschitz连续性约束归一化)方法。作者首先从理论角度分析了GAN泛化误差,发现减少判别器权重梯度范数对提升泛化能力至关重要。然后深入研究了批归一化(BN)在GAN判别器中应用困难的根本原因,通过理论分析证明BN的中心化和缩放步骤会导致梯度爆炸。基于这些发现,CHAIN设计了两个核心模块:用零均值正则化替代中心化步骤的0MR模块,以及带有Lipschitz约束的自适应均方根归一化ARMS模块。CHAIN通过自适应插值机制平衡归一原创 2025-07-05 14:45:12 · 183 阅读 · 0 评论 -
StackGAN(堆叠生成对抗网络)
本文提出了StackGAN(堆叠生成对抗网络),解决从文本描述生成高分辨率照片级真实图像的挑战。该方法将复杂的生成任务分解为两个阶段:Stage-I GAN生成64×64的粗糙轮廓和基本颜色,Stage-II GAN基于Stage-I结果和文本描述生成256×256的高分辨率图像并修正缺陷。同时引入条件增强技术提高训练稳定性和样本多样性。原创 2025-06-30 20:17:58 · 217 阅读 · 0 评论 -
利用Pytorch玩一玩文生图的HDGAN
简介:这篇论文提出了一种名为HDGAN (Hierarchically-nested Discriminators GAN)的新方法,用于解决文本到图像合成这一挑战性任务。该方法的主要创新点包括:分层嵌套对抗目标、单流生成器架构、多目的对抗损失并引入新评估指标视觉-语义原创 2025-06-25 20:52:29 · 228 阅读 · 0 评论 -
一种基于最小二乘生成对抗网络的图像去噪算法
本文提出了一种基于最小二乘生成对抗网络(LSGAN)的新颖图像去噪算法,成功解决了传统去噪方法在边缘计算环境下的局限性。原创 2025-06-20 11:35:39 · 175 阅读 · 0 评论 -
GAN中的SSIM指标:图像质量评估的利器
SSIM(Structural Similarity Index Measure,结构相似性指数)作为一种更贴近人类视觉感知的图像质量评估指标,在GAN的评估体系中发挥着重要作用。原创 2025-06-16 21:48:14 · 320 阅读 · 0 评论 -
利用IS模型评估生成的图像质量
利用IS模型评估生成的图像质量原创 2025-06-12 21:43:02 · 299 阅读 · 0 评论 -
GAN+ECA注意力机制实现图像超分辨率重建
SRGAN融合ECA注意力机制,并讨论了去掉BN层的效果。原创 2025-06-12 21:05:16 · 239 阅读 · 0 评论 -
GAN模式奔溃的探讨论文综述(一)
介绍了一篇关于模式崩溃的综述,给大家借鉴一些研究方向。模式崩溃是GANs面临的一个重大挑战,主要由学习率不平衡、训练数据多样性不足、局部最优问题和标签数据不足等因素引起。为了解决这一问题,研究者们提出了多种策略,包括平衡训练动态、引入正则化技术、改进损失函数、使用经验重放机制和利用可解释性技术等。同时,未来的研究方向可以集中在混合模型、自动超参数优化、集成学习、强化学习和多模态生成等领域,以进一步提高GAN的性能和生成数据的多样性。原创 2025-06-06 22:44:25 · 456 阅读 · 4 评论 -
R3GAN利用配置好的Pytorch训练自己的数据集
这篇论文挑战了"GANs难以训练"的广泛观点,通过提出一个更稳定的损失函数和现代化的网络架构,构建了一个简洁而高效的GAN基线模型R3GAN。作者证明了通过合适的理论基础和架构设计,GANs可以稳定训练并达到优异性能。原创 2025-05-29 18:36:41 · 549 阅读 · 0 评论 -
PSNR指标Pytorch实现
PSNR(Peak Signal-to-Noise Ratio,峰值信噪比) 是一个评估图像质量的重要指标,广泛用于衡量GAN生成图像与真实图像之间的相似度。原创 2025-05-26 11:14:19 · 398 阅读 · 0 评论 -
基于热力学熵增原理的EM-GAN
提出基于热力学熵增原理的EM-GAN,通过生成器熵最大化约束增强输出多样性。引入熵敏感激活函数与特征空间熵计算模块,在MNIST/CelebA等数据集上实现FID分数提升23.6%,有效缓解模式崩溃问题。原创 2025-05-31 15:00:00 · 307 阅读 · 0 评论 -
GAN-STD:融合检测器与生成器的方法
通过浅层-深层特征对抗机制缩小目标表征差异,检测损失反向传播实现端到端优化,在检测器上构建GAN,实现小目标检测精度显著提升。原创 2025-05-25 15:00:00 · 123 阅读 · 0 评论 -
一种基于条件约束注意力生成对抗网络的水下图像增强模型
作者针对水下图像颜色失真、对比度低等问题,提出了一种基于条件约束注意力生成对抗网络的水下图像增强模型。对于生成器,主要通过U-Net架构,通过跳跃连接融合多尺度特征,并引入空间注意力模块(双路池化+残差连接)增强高频细节;对于判别器,通过条件对抗机制优化特征差异;组合损失函数融合对抗损失、MSE、L1及VGG内容损失,提升训练稳定性。原创 2025-05-18 19:50:16 · 261 阅读 · 0 评论 -
HINT: High-quality INpainting Transformer with Mask-Aware Encoding and Enhanced Attention 训练自己的数据集
HINT(高质量图像修复变换器)通过创新的掩码感知像素洗牌下采样模块(MPD)和空间激活通道注意力层(SCAL),显著提高了图像修复的质量,尤其在大面积缺失区域的情况下。实验表明,HINT在CelebA、CelebA-HQ、Places2和敦煌数据集上超越了现有的最先进模型,提升了图像的细节和结构一致性。原创 2025-05-11 13:38:14 · 206 阅读 · 9 评论 -
一种基于条件生成对抗网络(cGAN)的CT重建算法
该文提出了一种基于条件生成对抗网络(cGAN)的CT重建算法,通过引入CBAM注意力机制增强网络对关键特征的提取能力,有效解决了CT成像中因噪声干扰导致的重建精度下降问题。实验采用固体火箭发动机模拟件数据集,将正弦图分为五组并添加不同程度的噪声进行训练。结果表明,与传统FBP算法相比,该方法在噪声增加时仍能保持高质量重建,显著提升了图像清晰度和精度。研究验证了cGAN结合注意力机制在CT重建中的优越性能,为工业CT图像处理提供了新的解决方案。原创 2025-05-06 20:17:36 · 291 阅读 · 0 评论 -
基于生成对抗网络的遥感图像去雾研究Pytorch代码复现
复现了一篇关于针对遥感图像受大气雾霾、尘埃等干扰导致图像模糊的问题的GAN模型结构用于训练自己的数据集。作者提出了一种基于生成对抗网络(GAN)的端到端去雾方法。该方法通过创新的生成器与判别器结构设计,结合多元损失函数,在定量指标(PSNR、SSIM)和主观视觉效果上均显著优于现有算法。原创 2025-04-30 18:21:43 · 170 阅读 · 0 评论 -
WGAN+U-Net架构实现图像修复
该论文提出了一种基于Wasserstein生成对抗网络(WGAN)的图像修复方法,结合U-Net生成器和条件判别器(CGAN),通过对抗损失与内容损失联合训练,有效解决了传统方法对破损区域形状大小受限、修复痕迹明显的问题。在CelebA和LFW数据集上的实验表明,该方法修复效果优于现有技术,尤其对大区域和不规则破损具有鲁棒性原创 2025-04-24 19:39:27 · 208 阅读 · 0 评论
分享