篝火者2312-优快云博客

原创【NeurlPS 2024】MAR：无矢量量化的自回归图像生成

本期内容，我们将MAR（掩码自回归模型）。与传统的视觉自回归需要把图像离散化成一个个token的方式不同。MAR构建的是一个连续型的自回归模型。MAR：无矢量量化的自回归图像生成。

2025-04-26 19:57:15 1094

原创 DragDiffusion：利用扩散模型进行基于点的交互式图像编辑

本篇文章，我们来讲DragDiffusion，他与DragGAN是一个差不多的。只是一个是用GAN去做；一个是用Diffusion去做。总之就是换汤不换药。

2025-03-14 14:26:25 845

原创 Diffusion_Autoencoder：扩散自编码器

本期内容，我们讲Diffusion Autoencoder，这是一个基于自编码器和扩散模型组合而成的模型，主要为了通过他们，去学习到图像的语义表征。然后再使用这些表征去用于其他下游任务。Diffusion AutoEncoder：扩散自编码器参考论文：[

2025-03-10 12:32:00 911

原创【深度学习】VITS语音合成原理解析

1、前言呃。。。好多天没更新了，最近黑神话悟空相当火啊，看上瘾了。本篇内容，我们来讲一下VITS。视频：语言合成 & 变声器 ——VITS原理解析①_哔哩哔哩_bilibili2、VITS训练图预测图：2.1、条件VAE的优化目标对于VITS，其实可以看做是一个条件VAE，所以我们直接开始求极大似然（x是音频，c是对应条件，如文本等等）log⁡P(x∣c)=log⁡P(x,z∣c)P(z∣x,c)\begin{aligned}\log P(x|c)&=\log \f

2024-10-31 17:44:59 807 1

原创 CVAE条件生成原理推导

本篇文章，我们来讲一下条件VAE，也就是CVAE。主要是下一期内容需要用到这个东西，而我们之前又没有讲过。所以来简单推导一下[VAE问题解答+CVAE原理解析-哔哩哔哩]

2024-08-15 20:04:12 2475

原创一文教会你该如何去学习人工智能！

本篇文章，主要是为了给大家一个学习AI的学习路线。目前网络上有很多的网络资源，但是很多人都是东捡一集，西捡一集，导致学习体系不完备，加上学习资源的质量参差不齐。最终总是遇到各种各样奇怪的问题。所以，本篇文章，我将跟大家说一下，从零基础，该如何学习。【一个视频教会你该如何去学习人工智能！-哔哩哔哩】

2024-08-05 11:25:36 1522

原创 Normalizing Flow流模型——NICE原理解析

NormalizingflowNormalizingflow，流模型，一种能够与目前流行的生成模型——GANVAEGANVAE相媲美的模型。其也是一个生成模型，可是它的思路和另外两个的迂回策略却很大不同。本文我们就简单来介绍一个这个模型吧论文：[[NICE——Normalizing Flow原理解析]

2024-07-28 17:44:38 1442

原创 SimMIM：一个类BERT的计算机视觉的预训练框架

呃…好久没有写博客了，主要是最近时间比较少。今天来做一期视频+博客的内容。本文主要讲SimMIM，它是一个将计算机视觉（图像）进行自监督训练的框架。SimMIM：用于掩码图像建模的简单框架 (arxiv.org)代码实现：https://github.com/microsoft/SimMIM【SimMIM：计算机视觉的随机掩码预训练-哔哩哔哩】

2024-07-16 15:07:37 951

原创扩散模型条件生成——Classifier Guidance和Classifier-free Guidance原理解析

从讲扩散模型到现在。我们很少讲过条件生成（Stable DIffusion曾提到过一点），所以本篇内容。我们就来具体讲一下条件生成。这一部分的内容我就不给原论文了，因为那些论文并不只讲了条件生成，还有一些调参什么的。并且推导过程也相对复杂。我们从一个比较简单的角度出发。参考代码：[扩散模型条件生成——Classifier Guidance和Classifier-free Guidance原理解析-哔哩哔哩]

2024-06-08 17:42:30 9924 3

原创如何微调出自己的大模型——LoRA原理解析

上一篇文章，我们已经讲了隐扩散模型——Stable Diffusion生成大模型。这种大模型，参数量及其之大。你没有足够的算力资源，就只能够使用人家已经训练好的大模型。既然没有办法训练属于自己的模型，那我们就想，是否可以在别人已经训练好的大模型的基础上，用我们自己的训练数据，对模型进行微调，从而得到我们想要的模型。github.com[如何微调出属于自己大模型？——LORA原理解析-哔哩哔哩]

2024-06-05 00:04:46 1392

原创 Stable diffusion文生图大模型——隐扩散模型原理解析

本篇文章，我们将讲这些年非常流行的文生图大模型——Stable Diffusion。该模型也不难，甚至说很简单。创新点也相对较少，如果你学会了我以前的文章讲过的模型，学习这个也自然水到渠成！[Stable diffusion生成大模型——隐扩散模型原理解析-哔哩哔哩]

2024-06-03 15:54:33 2672 3

原创基于SDE的分数生成模型

1、前言本篇文章，将从SDE（随机微分方程）视角，去解释前两个模型（DDPM、NCSN），将它们统一起来。并从SDE视角上，提供一个具有更高似然的新模型。与此同时，提供各种新式采样方法。参考论文：①Score-Based Generative Modeling through Stochastic Differential Equations (arxiv.org)②Tutorial on Diffusion Models for Imaging and Vision (arxiv.org)（这篇论

2024-06-01 16:16:17 1160

原创噪声条件分数网络——NCSN原理解析

本篇文章，我们讲NCSN，也就是噪声条件分数网络。这是宋飏老师在2019年提出的模型，思路与传统的生成模型大不相同，令人拍案叫绝！！！[噪声条件得分(分数)网络——NCSN原理解析-哔哩哔哩]Ps：这篇文章我简单讲一下思路就算了，过程并不严谨，因为这个内容并不是很重要。

2024-05-23 23:46:06 2547 3

原创【深度学习】加速采样生成图像——DDIM原理解析

文章目录1、前言2、DDPM回顾及为何不能跳步采样2.1、回顾2.2、为什么DDPM不能跳步采样？2.3、DDPM的困境3、DDIM3.1、马尔可夫假设3.2、跳步采样构造3.3、DDIM的目标函数3.4、求解目标函数3.4.1、设定逆扩散过程3.4.2、求解KL散度3.5、采样方法3.6、方差的选定4、其他细节5、结束6、参考1、前言在上篇文章，我们已经讲了Diffusion扩散模型原理解析，或者说，其实不能把它视作是Diffusion，我所讲的内容，其实只是按照里面的第二篇参考论文来的，第二篇论文是

2024-05-20 14:44:13 2694 7

原创【深度学习】Diffusion扩散模型的逆扩散问题

上一篇，我们讲了Diffusion这个模型的原理推导。但在推导中，仍然遗留了一些问题。本文将解决那些问题[Diffusion扩散模型补充-哔哩哔哩]

2024-05-11 15:52:06 1578

原创【深度学习】Diffusion扩散模型原理解析2

由于篇幅受限，优快云不能发布超过一定次数的文章，故在此给出上一篇链接：【深度学习】diffusion原理解析3.2、目标函数求解里面的最后一项，q(xT∣x0)q(x_T|x_0)q(xT∣x0)我们前面提到过，其近似服从标准正态，而对于P(xT)P(x_T)P(xT)，我们是假定为标准正态，这两项都可以求出来，所以没有任何可学习的参数真正需要优化的是第一项和第二项。第一项就是重构损失；而第二项，是KL散度。里面的P(xt−1∣xt)P(x_{t-1}|x_t)P(xt−1∣xt)需要用神

2024-05-10 16:48:15 1088 1

原创【深度学习】Diffusion扩散模型原理解析1

1、前言diffusion，这几年一直很火的模型，比如这段时间在网上的文生图大模型——Stable diffusion。就是以diffusion作为基底模型，但由于该模型与VAE那边，都涉及了较多了概率论知识，实在让人望而却步。所以，本文将对diffusion进行数学原理推导，如果你没有上过概率论这门课，建议先去学。论文：①Deep Unsupervised Learning using Nonequilibrium Thermodynamics (arxiv.org)②Denoising Diff

2024-05-10 16:42:22 4859 5

原创【深度学习】VAE变分自编码器原理推导+Python代码实现

1、前言变分自编码器是近些年较火的一个生成模型，我个人认为其本质上仍然是一个概率图模型，只是在此基础上引入了神经网络。本文将就变分自编码器（VAE）进行简单的原理讲解和数学推导。论文： Auto-Encoding Variational Bayes视频：2、引入2.1、高斯混合模型生成模型，可以简单的理解为生成数据(不止，但我们暂且就这么理解它)\boxed{(不止，但我们暂且就这么理解它)}(不止，但我们暂且就这么理解它)。假如现在我们有样本数据，而我们发现这些样本符合正态分布且样本具有充分

2024-05-02 22:33:25 5760 11

原创生成模型必备数学基础——概率论基础复习

本篇复习一些机器学习和深度学习常用的概率论的基础知识，因为我发现有挺多人对这些东西都不了解，或者说忘了，所以，本篇文章，意在唤醒你那已经交还给老师的概率论基础记忆，以为下一篇文章做基础[数学基础——生成模型必备知识-哔哩哔哩]

2024-04-29 18:46:37 1840 1

原创 GPT与GAN结合生成图像——VQGAN原理解析

这篇文章，我们讲VQ_GAN，这是一个将特征向量离散化的模型，其效果相当不错，搭配Transformer（GPT）或者CLIP使用，达到的效果在当时可谓是令人拍案叫绝！[GPT与GAN结合生成图像——VQGAN原理解析-哔哩哔哩]效果演示：图像生成其他任务。

2024-04-23 18:15:11 4218 1

原创【深度学习】写实转漫画——CycleGAN原理解析

上一篇，我们讲解了按照指定文本标签生成对应图像的CGAN。本篇文章，我们讲CycleGAN。

2024-04-17 21:33:10 1407 4

原创【深度学习】伪造指定图像——CGAN原理解析及其代码实现

本篇介绍条件GAN——CGAN，这其实是一个挺简单的模型，只要你知道GAN这个模型，就很容易能够看懂这个，因为CGAN就是在GAN的基础上加上了一个条件，CGAN的作用就是可以依据标签生成对应的图像。【伪造指定图像——CGAN原理解析-哔哩哔哩】

2024-04-17 13:22:21 3560

原创【深度学习】AI修图——DragGAN原理解析

上一篇，我们讲述了StyleGAN2。这一篇，我们就来讲一个把StyleGAN2作为基底架构的DragGAN。DragGAN的作用主要是对图片进行编辑，说厉害点，可能和AI修图差不多。这篇论文比较新，发表自2023年参考代码：https://github.com/skimai/DragGANAI修图——DragGAN原理解析-哔哩哔哩演示（随意选择红点，让红点对应位置的像素移动到蓝点）：demo。

2024-04-15 20:41:27 2835

原创【深度学习】图像风格混合——StyleGAN2原理解析

上一篇文章，我们详细讲解了StyleGAN的原理。这篇文章，我们就来讲解一下StyleGAN2，也就是StyleGAN的改进版。①Pytorch版本，非官方 PS：推荐看代码②，里面对每行都进行了注释。【图像风格混合——StyleGAN2原理解析-哔哩哔哩】

2024-04-13 15:41:31 3332 1

原创【深度学习】图像风格混合——StyleGAN原理解析

上一篇，我们讲了PGGAN的模型原理，本章我们就来讲解一下StyleGAN，这个模型能够自由控制图像的风格，细节变化等等，生成用户想要的图像，甚至从某种程度上说，其可以实现AI换脸。PS：这篇文章其实我做了很多功课，本来不想写的。因为对于我这种水平的人来说，论文太难理解，不仅翻译过来语句不顺（本人英语不好，只能看机翻的版本），里面的原理部分也感觉相当抽象。本来想在网上搜一些文章来看一下，结果很多文章都是跟机器翻译直接复制过来的一样，完全不作解释，晦涩难懂。

2024-04-08 22:11:22 8497 8

原创伪造高清人像——PGGAN原理解析

本文将对PGGAN这个模型进行原理解析，该模型是生成模型，与GAN一样，他也同样可以伪造数据（如图像），区别在于，这个模型算是GAN的进阶版，其克服了GAN模型中的很多问题【伪造高清人像——PGGAN原理解析-哔哩哔哩】

2024-04-02 23:40:00 2208

原创【强化学习】Qlearning代码实现

Qlearning其实就是在SARSA作了一点点修改，如果采取随机探索，时序差分的更新仍然使用概率最大。这种方法雀食能够在一定程度上加速模型的收敛。

2024-01-08 11:48:44 968

原创【强化学习】SARAS代码实现

SARAS，假设环境状态和动作状态都是离散的。利用动作价值矩阵来进行行为的预测。其主要就是利用时序差分的思想，对动作价值矩阵进行更新。

2023-12-31 21:07:47 614

原创【深度学习】GAN生成对抗网络原理推导+代码实现（Python）

本文将讲近些年来挺火的一个生成模型GAN生成对抗网络\boxed{\mathbf{GAN生成对抗网络}}GAN生成对抗网络，其特殊的思路解法实在让人啧啧称奇。

2023-12-18 18:03:08 10798 34

原创【深度学习】深度置信网络原理推导 + Python代码实现

上一篇，我们讲了受限玻尔兹曼机的原理推导和代码实现，本文将介绍深度置信网络（DBN）的简单原理和算法流程，不会涉及过多的原理推导。

2023-12-11 09:19:20 3014 6

原创受限玻尔兹曼机代码实现（Python）

上一篇受限玻尔兹曼机原理推导，我们讲了受限玻尔兹曼机的原理推导。本文，我们来看看受限玻尔兹曼机如何应用到推荐系统中。

2023-12-04 19:42:45 849

原创【深度学习】受限玻尔兹曼机原理推导

1、前言受限玻尔兹曼机，一个基于概率图的模型。本文对受限玻尔兹曼机的原理进行简单推导，其中相关知识的某些原理也不会过多涉及，只着重于受限玻尔兹曼机。2、引入2.1、无向图在一张图中，我们存在一些节点和边，这些节点之间存在的某种关系，通过边来表示，节点和边共同组成了一张图，并且这些边是没有方向的（即互联），这种图被称为无向图。在我们应用的过程中，里面的每一个节点，一般就是我们某个数据的一个维度。比如假设某个样本xi∈(x1,x2,x3,x4,x5)x_i \in (x_1,x_2,x_3,x_4,

2023-12-04 19:40:48 1540

原创谱聚类代码实现（Python）

上一篇谱聚类原理推导，我们已经对谱聚类的原理进行了推导，本文将利用谱聚类，基于Python，实现聚类。

2023-11-27 09:11:54 898

原创【机器学习】谱聚类原理推导

一、前言本文将介绍一种较为突出的聚类算法——谱聚类。这是一种基于图模型的算法。有过图论或者数据结构基础的人估计会相对来说觉得容易。能力有限，推导并不严谨，请见谅。二、相关知识2.1、无向图无向图，由两个要素构成——节点和边。以上面的无向图为例节点，我们定义为V={A,B,C,D,E}V=\{A,B,C,D,E\}V={A,B,C,D,E}。边定义为E={w1,w2,w3,w4,w5}E=\{w_1,w_2,w_3,w_4,w_5\}E={w1,w2,w3,w4,w5}对应图中的w1…。

2023-11-27 09:09:06 300

原创【机器学习】高斯过程回归代码（Python）

上一篇高斯过程回归原理推导，我们已经就高斯过程回归进行了数学推导。此时就使用Python对其进行代码实现。

2023-11-20 17:22:40 1286

原创【机器学习】高斯过程回归原理推导

1、前言高斯过程，是随机过程的一种。高斯过程回归，和线性回归有些相似，总之就是用数据去拟合出一条线，然后做预测。2、引入在了解高斯过程之前。我们得知道什么是高斯分布。高斯分布，在一维的时候，给定期望和方差，可以唯一确定一个概率分布。在期望为0，方差为1高斯分布，其密度函数为这是一维的情况，同理的还有多维高斯分布。所谓多维高斯分布，其实就是将原本一维的高斯分布在不同方位堆叠，如果维度之间存在关系，则会就不能简单堆叠。假如我们有p维的高斯分布，那么相应的就要给出p维的期望，而对应的方差就变成了p×pp

2023-11-20 17:19:05 2746

空空如也

空空如也