- 博客(64)
- 收藏
- 关注
原创 DragDiffusion:利用扩散模型进行基于点的交互式图像编辑
本篇文章,我们来讲DragDiffusion,他与DragGAN是一个差不多的。只是一个是用GAN去做;一个是用Diffusion去做。总之就是换汤不换药。
2025-03-14 14:26:25
766
原创 Diffusion_Autoencoder:扩散自编码器
本期内容,我们讲Diffusion Autoencoder,这是一个基于自编码器和扩散模型组合而成的模型,主要为了通过他们,去学习到图像的语义表征。然后再使用这些表征去用于其他下游任务。Diffusion AutoEncoder:扩散自编码器 参考论文:[
2025-03-10 12:32:00
775
原创 【深度学习】VITS语音合成原理解析
1、前言呃。。。好多天没更新了,最近 黑神话悟空 相当火啊,看上瘾了。本篇内容,我们来讲一下VITS。视频:语言合成 & 变声器 ——VITS原理解析①_哔哩哔哩_bilibili2、VITS训练图预测图:2.1、条件VAE的优化目标对于VITS,其实可以看做是一个条件VAE,所以我们直接开始求极大似然(x是音频,c是对应条件,如文本等等)logP(x∣c)=logP(x,z∣c)P(z∣x,c)\begin{aligned}\log P(x|c)&=\log \f
2024-10-31 17:44:59
681
1
原创 CVAE条件生成原理推导
本篇文章,我们来讲一下条件VAE,也就是CVAE。主要是下一期内容需要用到这个东西,而我们之前又没有讲过。所以来简单推导一下[VAE问题解答+CVAE原理解析-哔哩哔哩]
2024-08-15 20:04:12
2203
原创 一文教会你该如何去学习人工智能!
本篇文章,主要是为了给大家一个学习AI的学习路线。目前网络上有很多的网络资源,但是很多人都是东捡一集,西捡一集,导致学习体系不完备,加上学习资源的质量参差不齐。最终总是遇到各种各样奇怪的问题。所以,本篇文章,我将跟大家说一下,从零基础,该如何学习。【一个视频教会你该如何去学习人工智能!-哔哩哔哩】
2024-08-05 11:25:36
1367
原创 Normalizing Flow流模型——NICE原理解析
NormalizingflowNormalizingflow,流模型,一种能够与目前流行的生成模型——GANVAEGANVAE相媲美的模型。其也是一个生成模型,可是它的思路和另外两个的迂回策略却很大不同。本文我们就简单来介绍一个这个模型吧论文:[[NICE——Normalizing Flow原理解析]
2024-07-28 17:44:38
1261
原创 SimMIM:一个类BERT的计算机视觉的预训练框架
呃…好久没有写博客了,主要是最近时间比较少。今天来做一期视频+博客的内容。本文主要讲SimMIM,它是一个将计算机视觉(图像)进行自监督训练的框架。SimMIM:用于掩码图像建模的简单框架 (arxiv.org)代码实现:https://github.com/microsoft/SimMIM【SimMIM:计算机视觉的随机掩码预训练-哔哩哔哩】
2024-07-16 15:07:37
917
原创 扩散模型条件生成——Classifier Guidance和Classifier-free Guidance原理解析
从讲扩散模型到现在。我们很少讲过条件生成(Stable DIffusion曾提到过一点),所以本篇内容。我们就来具体讲一下条件生成。这一部分的内容我就不给原论文了,因为那些论文并不只讲了条件生成,还有一些调参什么的。并且推导过程也相对复杂。我们从一个比较简单的角度出发。参考代码:[扩散模型条件生成——Classifier Guidance和Classifier-free Guidance原理解析-哔哩哔哩]
2024-06-08 17:42:30
9016
3
原创 如何微调出自己的大模型——LoRA原理解析
上一篇文章,我们已经讲了隐扩散模型——Stable Diffusion生成大模型。这种大模型,参数量及其之大。你没有足够的算力资源,就只能够使用人家已经训练好的大模型。既然没有办法训练属于自己的模型,那我们就想,是否可以在别人已经训练好的大模型的基础上,用我们自己的训练数据,对模型进行微调,从而得到我们想要的模型。github.com[如何微调出属于自己大模型?——LORA原理解析-哔哩哔哩]
2024-06-05 00:04:46
1323
原创 Stable diffusion文生图大模型——隐扩散模型原理解析
本篇文章,我们将讲这些年非常流行的文生图大模型——Stable Diffusion。该模型也不难,甚至说很简单。创新点也相对较少,如果你学会了我以前的文章讲过的模型,学习这个也自然水到渠成![Stable diffusion生成大模型——隐扩散模型原理解析-哔哩哔哩]
2024-06-03 15:54:33
2487
3
原创 基于SDE的分数生成模型
1、前言本篇文章,将从SDE(随机微分方程)视角,去解释前两个模型(DDPM、NCSN),将它们统一起来。并从SDE视角上,提供一个具有更高似然的新模型。与此同时,提供各种新式采样方法。参考论文:①Score-Based Generative Modeling through Stochastic Differential Equations (arxiv.org)②Tutorial on Diffusion Models for Imaging and Vision (arxiv.org)(这篇论
2024-06-01 16:16:17
1073
原创 噪声条件分数网络——NCSN原理解析
本篇文章,我们讲NCSN,也就是噪声条件分数网络。这是宋飏老师在2019年提出的模型,思路与传统的生成模型大不相同,令人拍案叫绝!!![噪声条件得分(分数)网络——NCSN原理解析-哔哩哔哩]Ps:这篇文章我简单讲一下思路就算了,过程并不严谨,因为这个内容并不是很重要。
2024-05-23 23:46:06
2372
3
原创 【深度学习】加速采样生成图像——DDIM原理解析
文章目录1、前言2、DDPM回顾及为何不能跳步采样2.1、回顾2.2、为什么DDPM不能跳步采样?2.3、DDPM的困境3、DDIM3.1、马尔可夫假设3.2、跳步采样构造3.3、DDIM的目标函数3.4、求解目标函数3.4.1、设定逆扩散过程3.4.2、求解KL散度3.5、采样方法3.6、方差的选定4、其他细节5、结束6、参考1、前言在上篇文章,我们已经讲了Diffusion扩散模型原理解析,或者说,其实不能把它视作是Diffusion,我所讲的内容,其实只是按照里面的第二篇参考论文来的,第二篇论文是
2024-05-20 14:44:13
2316
7
原创 【深度学习】Diffusion扩散模型的逆扩散问题
上一篇,我们讲了Diffusion这个模型的原理推导。但在推导中,仍然遗留了一些问题。本文将解决那些问题[Diffusion扩散模型补充-哔哩哔哩]
2024-05-11 15:52:06
1499
原创 【深度学习】Diffusion扩散模型原理解析2
由于篇幅受限,优快云不能发布超过一定次数的文章,故在此给出上一篇链接:【深度学习】diffusion原理解析3.2、目标函数求解里面的最后一项,q(xT∣x0)q(x_T|x_0)q(xT∣x0)我们前面提到过,其近似服从标准正态,而对于P(xT)P(x_T)P(xT),我们是假定为标准正态,这两项都可以求出来,所以没有任何可学习的参数真正需要优化的是第一项和第二项。第一项就是重构损失;而第二项,是KL散度。里面的P(xt−1∣xt)P(x_{t-1}|x_t)P(xt−1∣xt)需要用神
2024-05-10 16:48:15
974
1
原创 【深度学习】Diffusion扩散模型原理解析1
1、前言diffusion,这几年一直很火的模型,比如这段时间在网上的文生图大模型——Stable diffusion。就是以diffusion作为基底模型,但由于该模型与VAE那边,都涉及了较多了概率论知识,实在让人望而却步。所以,本文将对diffusion进行数学原理推导,如果你没有上过概率论这门课,建议先去学。论文:①Deep Unsupervised Learning using Nonequilibrium Thermodynamics (arxiv.org)②Denoising Diff
2024-05-10 16:42:22
2686
4
原创 【深度学习】VAE变分自编码器原理推导+Python代码实现
1、前言变分自编码器是近些年较火的一个生成模型,我个人认为其本质上仍然是一个概率图模型,只是在此基础上引入了神经网络。本文将就变分自编码器(VAE)进行简单的原理讲解和数学推导。论文: Auto-Encoding Variational Bayes视频:2、引入2.1、高斯混合模型生成模型,可以简单的理解为生成数据(不止,但我们暂且就这么理解它)\boxed{(不止,但我们暂且就这么理解它)}(不止,但我们暂且就这么理解它)。假如现在我们有样本数据,而我们发现这些样本符合正态分布且样本具有充分
2024-05-02 22:33:25
5223
11
原创 生成模型必备数学基础——概率论基础复习
本篇复习一些机器学习和深度学习常用的概率论的基础知识,因为我发现有挺多人对这些东西都不了解,或者说忘了,所以,本篇文章,意在唤醒你那已经交还给老师的概率论基础记忆,以为下一篇文章做基础[数学基础——生成模型必备知识-哔哩哔哩]
2024-04-29 18:46:37
1780
1
原创 GPT与GAN结合生成图像——VQGAN原理解析
这篇文章,我们讲VQ_GAN,这是一个将特征向量离散化的模型,其效果相当不错,搭配Transformer(GPT)或者CLIP使用,达到的效果在当时可谓是令人拍案叫绝![GPT与GAN结合生成图像——VQGAN原理解析-哔哩哔哩]效果演示:图像生成其他任务。
2024-04-23 18:15:11
3961
1
原创 【深度学习】写实转漫画——CycleGAN原理解析
上一篇,我们讲解了按照指定文本标签生成对应图像的CGAN。本篇文章,我们讲CycleGAN。
2024-04-17 21:33:10
1309
4
原创 【深度学习】伪造指定图像——CGAN原理解析及其代码实现
本篇介绍条件GAN——CGAN,这其实是一个挺简单的模型,只要你知道GAN这个模型,就很容易能够看懂这个,因为CGAN就是在GAN的基础上加上了一个条件,CGAN的作用就是可以依据标签生成对应的图像。【伪造指定图像——CGAN原理解析-哔哩哔哩】
2024-04-17 13:22:21
3324
原创 【深度学习】AI修图——DragGAN原理解析
上一篇,我们讲述了StyleGAN2。这一篇,我们就来讲一个把StyleGAN2作为基底架构的DragGAN。DragGAN的作用主要是对图片进行编辑,说厉害点,可能和AI修图差不多。这篇论文比较新,发表自2023年参考代码:https://github.com/skimai/DragGANAI修图——DragGAN原理解析-哔哩哔哩演示(随意选择红点,让红点对应位置的像素移动到蓝点):demo。
2024-04-15 20:41:27
2660
原创 【深度学习】图像风格混合——StyleGAN2原理解析
上一篇文章,我们详细讲解了StyleGAN的原理。这篇文章,我们就来讲解一下StyleGAN2,也就是StyleGAN的改进版。①Pytorch版本,非官方 PS:推荐看代码②,里面对每行都进行了注释。【图像风格混合——StyleGAN2原理解析-哔哩哔哩】
2024-04-13 15:41:31
3106
原创 【深度学习】图像风格混合——StyleGAN原理解析
上一篇,我们讲了PGGAN的模型原理,本章我们就来讲解一下StyleGAN,这个模型能够自由控制图像的风格,细节变化等等,生成用户想要的图像,甚至从某种程度上说,其可以实现AI换脸。PS:这篇文章其实我做了很多功课,本来不想写的。因为对于我这种水平的人来说,论文太难理解,不仅翻译过来语句不顺(本人英语不好,只能看机翻的版本),里面的原理部分也感觉相当抽象。本来想在网上搜一些文章来看一下,结果很多文章都是跟机器翻译直接复制过来的一样,完全不作解释,晦涩难懂。
2024-04-08 22:11:22
6931
8
原创 伪造高清人像——PGGAN原理解析
本文将对PGGAN这个模型进行原理解析,该模型是生成模型,与GAN一样,他也同样可以伪造数据(如图像),区别在于,这个模型算是GAN的进阶版,其克服了GAN模型中的很多问题【伪造高清人像——PGGAN原理解析-哔哩哔哩】
2024-04-02 23:40:00
2070
原创 【强化学习】Qlearning代码实现
Qlearning其实就是在SARSA作了一点点修改,如果采取随机探索,时序差分的更新仍然使用概率最大。这种方法雀食能够在一定程度上加速模型的收敛。
2024-01-08 11:48:44
941
原创 【强化学习】SARAS代码实现
SARAS,假设环境状态和动作状态都是离散的。利用动作价值矩阵来进行行为的预测。其主要就是利用时序差分的思想,对动作价值矩阵进行更新。
2023-12-31 21:07:47
581
原创 【深度学习】GAN生成对抗网络原理推导+代码实现(Python)
本文将讲近些年来挺火的一个生成模型GAN生成对抗网络\boxed{\mathbf{GAN生成对抗网络}}GAN生成对抗网络,其特殊的思路解法实在让人啧啧称奇。
2023-12-18 18:03:08
9882
34
原创 【深度学习】深度置信网络原理推导 + Python代码实现
上一篇,我们讲了受限玻尔兹曼机的原理推导和代码实现,本文将介绍深度置信网络(DBN)的简单原理和算法流程,不会涉及过多的原理推导。
2023-12-11 09:19:20
2747
6
原创 受限玻尔兹曼机代码实现(Python)
上一篇受限玻尔兹曼机原理推导,我们讲了受限玻尔兹曼机的原理推导。本文,我们来看看受限玻尔兹曼机如何应用到推荐系统中。
2023-12-04 19:42:45
751
原创 【深度学习】受限玻尔兹曼机原理推导
1、前言受限玻尔兹曼机,一个基于概率图的模型。本文对受限玻尔兹曼机的原理进行简单推导,其中相关知识的某些原理也不会过多涉及,只着重于受限玻尔兹曼机。2、引入2.1、无向图在一张图中,我们存在一些节点和边,这些节点之间存在的某种关系,通过边来表示,节点和边共同组成了一张图,并且这些边是没有方向的(即互联),这种图被称为无向图。在我们应用的过程中,里面的每一个节点,一般就是我们某个数据的一个维度。比如假设某个样本xi∈(x1,x2,x3,x4,x5)x_i \in (x_1,x_2,x_3,x_4,
2023-12-04 19:40:48
1394
原创 【机器学习】谱聚类原理推导
一、前言本文将介绍一种较为突出的聚类算法——谱聚类。这是一种基于图模型的算法。有过图论或者数据结构基础的人估计会相对来说觉得容易。能力有限,推导并不严谨,请见谅。二、相关知识2.1、无向图无向图,由两个要素构成——节点和边。以上面的无向图为例节点,我们定义为V={A,B,C,D,E}V=\{A,B,C,D,E\}V={A,B,C,D,E}。边定义为E={w1,w2,w3,w4,w5}E=\{w_1,w_2,w_3,w_4,w_5\}E={w1,w2,w3,w4,w5}对应图中的w1…。
2023-11-27 09:09:06
272
原创 【机器学习】高斯过程回归代码(Python)
上一篇高斯过程回归原理推导,我们已经就高斯过程回归进行了数学推导。此时就使用Python对其进行代码实现。
2023-11-20 17:22:40
1184
原创 【机器学习】高斯过程回归原理推导
1、前言高斯过程,是随机过程的一种。高斯过程回归,和线性回归有些相似,总之就是用数据去拟合出一条线,然后做预测。2、引入在了解高斯过程之前。我们得知道什么是高斯分布。高斯分布,在一维的时候,给定期望和方差,可以唯一确定一个概率分布。在期望为0,方差为1高斯分布,其密度函数为这是一维的情况,同理的还有多维高斯分布。所谓多维高斯分布,其实就是将原本一维的高斯分布在不同方位堆叠,如果维度之间存在关系,则会就不能简单堆叠。假如我们有p维的高斯分布,那么相应的就要给出p维的期望,而对应的方差就变成了p×pp
2023-11-20 17:19:05
2351
原创 【机器学习】贝叶斯线性回归代码实现(Python)
上一篇贝叶斯线性回归,我们已经从贝叶斯派的角度去推导了线性回归的参数表达式。本文,我们将对线性回归的的预测问题就行Python代码实现。
2023-11-15 21:41:33
964
原创 粒子滤波运动轨迹优化案例(Python)
上一篇【机器学习】粒子滤波原理推导(二),我们已经对粒子滤波的原理和实现流程进行了原理推导求解。接下来,我们就案例而言,来看看粒子滤波的实际应用。
2023-11-04 12:12:04
738
原创 【机器学习】粒子滤波原理推导(二)
上一篇【机器学习】粒子滤波原理推导(一),我们就如何去求解粒子滤波Filter问题的期望,得到了各种递推式。但是会产生权值退化的问题。这篇文章就解释一下什么是权值退化,又该如何去解决。
2023-11-04 12:07:49
225
原创 【机器学习】粒子滤波原理推导(一)
上一篇,我们已经对卡尔曼滤波进行数学推导和案例实现。可是,无论是隐马尔可夫模型还是卡尔曼滤波,它们或多或少的都存在着一些限制。对卡尔曼滤波而言,其要求噪声必须是高斯分布,并且必须是线性的。而对于粒子滤波而言,却没有这方面的限制。
2023-11-04 12:02:59
356
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人