
python
文章平均质量分 90
沉默媛
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Back to the Features: DINO as a Foundation for Video World Models论文中提到的RoPE编码是什么
RoPE(旋转位置编码)是一种通过旋转矩阵为序列数据注入位置信息的技术,能有效捕捉元素间的相对位置关系。其核心是利用旋转矩阵变换特征向量,保留相对位置信息并增强模型泛化能力。在图一视频模型中,RoPE用于将时空坐标注入块标记,辅助预测未来帧的时空特征。优势在于与自注意力机制无缝集成,计算效率高,适合处理时空数据。原创 2025-07-31 21:02:53 · 735 阅读 · 0 评论 -
Deep Learning_ Foundations and Concepts-Springer (2024)【拜读】20章3节
扩散模型(Diffusion Models)是一类基于逐步加噪和去噪过程的深度生成模型,通过将数据逐渐转化为高斯分布并训练神经网络逆转该过程来生成新样本。这类模型可视为分层变分自编码器的变体,具有训练稳定、生成质量高等特点,但计算成本较高。扩散模型与基于得分匹配(Score Matching)的生成模型密切相关,后者通过建模数据对数密度的梯度(得分函数)来近似数据分布。得分匹配的关键在于定义一个损失函数使模型预测的得分函数与真实数据得分匹配,通过引入高斯核平滑处理使离散经验分布可微,并推导出等效的损失函数形原创 2025-07-29 20:42:42 · 721 阅读 · 0 评论 -
分数函数的实用性及与数据密度的关系解析
摘要:分数函数(对数概率密度的梯度)在概率建模中具有重要意义。当两个概率密度函数q(x)和p(x)的分数函数相等时,数学推导表明它们仅相差一个乘法常数(q(x)=Kp(x))。学习分数函数模型s(x,w)虽无法精确确定原始密度,但能有效捕捉其核心特征,满足大多数应用中对密度形状和相对变化的分析需求,在数据生成、去噪等任务中具有实用价值。原创 2025-07-28 16:34:45 · 425 阅读 · 0 评论 -
Deep Learning_ Foundations and Concepts-Springer (2024)【拜读】20章2小节【 Reverse Decoder】
扩散模型是一种新兴的生成模型,通过逐步加噪和去噪的过程实现数据生成。其核心思想是:对训练图像进行多步加噪,最终转化为高斯分布样本,然后训练神经网络逆转该过程。扩散模型可视为分层变分自编码器的变体,其中编码器分布由加噪过程固定,仅需学习生成分布。模型训练采用证据下界(ELBO)优化目标,通过变分推断近似难以处理的后验分布。这种模型避免了对抗训练的不稳定性,生成质量优异,但计算成本较高,通常需要数千步采样。数学推导表明,当单步方差足够小时,逆向分布可近似为高斯分布,这为网络参数化提供了理论基础。原创 2025-07-28 15:42:35 · 916 阅读 · 0 评论 -
Deep Learning_ Foundations and Concepts-Springer (2024)【拜读】前向编码器20章
扩散模型(Diffusion Models)是一种基于深度神经网络的生成模型,通过逐步加噪和去噪的过程实现数据生成。其核心分为前向编码器和逆向解码器两部分: 前向编码器:通过马尔可夫链逐步对图像添加高斯噪声,每一步的噪声强度由超参数βₜ控制。该过程将原始图像x转化为纯噪声zₜ,且中间分布q(zₜ|x)具有闭式高斯解,支持高效采样。 逆向解码器:训练神经网络学习逆过程p(zₜ₋₁|zₜ),从噪声中逐步重建图像。扩散模型本质是固定编码器的分层变分自编码器,避免了对抗训练的不稳定性,生成质量媲美GAN,但计算成本原创 2025-07-28 15:39:59 · 865 阅读 · 0 评论 -
改进神经网络在马尔可夫链中去噪效果的方法及公式推导
本文提出了一种改进神经网络在马尔可夫链中去噪效果的方法。不同于传统神经网络直接预测去噪图像,该方法让神经网络预测添加到原始图像上的总噪声。通过关键公式推导,建立了神经网络函数之间的关系,并利用KL散度衡量分布差异。推导过程包括:1)将带噪图像表达式重新排列;2)得到反向条件分布均值;3)建立神经网络预测噪声与去噪图像的关系;4)简化KL散度表达式。该方法通过调整神经网络预测目标来最小化分布差异,为图像去噪提供了新思路。原创 2025-07-28 09:47:17 · 589 阅读 · 0 评论 -
扩散模型逆向过程详解:如何从噪声中恢复数据?
本文详细解析了扩散模型中逆向过程的条件分布$q(\mathbf{z}_{t-1} \mid \mathbf{z}_t, \mathbf{x})$的推导。通过贝叶斯定理和高斯分布性质,将条件分布分解为三个部分:前向转移概率、扩散核和常数项。利用马尔可夫性质和配方法,最终得出该条件分布为高斯形式,其均值是原始数据与噪声数据的线性组合,方差由噪声调度参数决定。这一推导为扩散模型提供了理论依据,指导神经网络学习去噪过程,确保从噪声生成数据的数学严谨性。原创 2025-07-26 12:28:50 · 879 阅读 · 0 评论 -
为什么公式20.1能转化为20.2(很简单,但是博主比较笨)
扩散模型的核心噪声添加公式可通过高斯分布的性质转换为条件概率形式。原始公式$z_{1} = \sqrt{1-\beta_1} \cdot x + \sqrt{\beta_1} \cdot \epsilon_{1}$利用线性变换特性,等价于$p(z_1 \mid x) = \mathcal{N}(\sqrt{1-\beta_1} \cdot x, \beta_1 \mathbf{I})$。这种转换保持了均值缩放和噪声方差控制,确保信号能量逐渐衰减,同时通过$\beta_t$调节噪声强度。其设计实现了方差守恒、原创 2025-07-26 11:55:39 · 875 阅读 · 0 评论 -
变分自编码器学习【下界的演算】
的计算过程,并指出了原始定义的问题及改进方向。在变分自编码器(VAE)或变分推断中,近似后验分布。这张图描述了变分自编码器(VAE)中关于生成概率。这里不明白的是为什么q(z|x)可以是任意分布?) 通常难以直接计算,因此引入近似分布。通过Jensen不等式,对数边缘似然。) 可固定为超参数,或由网络预测。VAE的核心目标是通过隐变量。为了解决上述问题,VAE将。) 并通过优化使其逼近。) 的分布形式不受限制?原创 2025-07-25 11:39:27 · 680 阅读 · 0 评论 -
扩散模型DDPM核心原理:从噪声到数据的生成魔法
本文系统解析了扩散概率模型(DDPM)的工作原理,包含前向加噪和反向去噪两个核心过程,通过数学公式推导和代码示例详细阐述了模型架构与训练方法。文章介绍了噪声调度、U-Net网络设计等关键技术细节,并分析了DDPM的稳定性和生成质量优势。最后展望了加速采样、提升多样性等未来发展方向,为理解这一生成式AI技术提供了清晰框架。原创 2025-07-25 11:25:15 · 937 阅读 · 0 评论 -
【NODDI】
NODDI是一种先进的扩散磁共振成像技术,通过三室模型量化神经突密度和纤维方向离散度,比传统DTI/DKI更能反映组织微观结构。其核心是将脑组织分为神经突内、外和脑脊液隔室,利用Watson分布模拟神经突取向,通过多壳HARDI采样策略获取高分辨率扩散数据。HARDI技术通过在q空间高b值多角度采样,能精确重建复杂纤维结构,其中扩散传播子描述水分子位移概率。NODDI结合HARDI的优化扫描方案,实现了对脑组织微观结构的精准表征。原创 2025-07-17 12:12:12 · 689 阅读 · 0 评论 -
注意力机制
注意力机制是一种受人类认知启发的深度学习技术,通过动态分配权重使模型聚焦输入数据的关键部分。其核心是通过可学习的权重矩阵(如查询-键-值计算)实现选择性关注,显著提升模型效率与准确性。该机制主要分为自注意力、空间注意力和时间注意力三类,广泛应用于计算机视觉、自然语言处理等领域。优势包括动态计算聚焦、可解释性强、跨模态对齐能力等。典型应用如Transformer中的自注意力机制,能有效建模长程依赖关系。该技术通过数学公式化的权重计算和层次化注意力分配,已成为深度学习的核心方法之一。原创 2025-07-17 12:10:54 · 692 阅读 · 0 评论 -
【深度学习-线性层/卷积层】
卷积操作是CNN的核心操作之一,其本质是将一个可移动的小窗口(称为卷积核或滤波器)与输入数据进行逐元素相乘并求和的过程。卷积核是一组可学习的权重,能够捕捉输入数据中的局部特征,例如图像中的边缘、纹理等。卷积层是CNN中最核心的层,其主要功能是通过卷积操作对输入数据进行特征提取。CNN的核心思想是通过卷积操作和池化操作提取输入数据的局部特征,从而实现对复杂数据的高效建模。池化层是CNN的另一个重要组成部分,其主要功能是通过降采样操作对特征图进行空间维度上的压缩,从而减少模型的复杂度。原创 2025-07-17 12:07:41 · 903 阅读 · 0 评论 -
如何安装python以及jupyter notebook
摘要:本文详细介绍了Python和Jupyter Notebook的安装方法。推荐新手使用Anaconda一键安装(包含两者),也可单独安装Python后通过pip安装Jupyter。文中提供了Windows/macOS/Linux的通用安装步骤,包括环境变量配置、验证安装、启动方法以及常见问题解决方案(如pip不可用、浏览器未自动打开等)。同时说明了如何使用Jupyter Notebook创建新文件运行代码,并附带了卸载指引。通过清晰的命令行示例和注意事项,帮助用户快速完成安装配置。原创 2025-07-10 22:21:53 · 426 阅读 · 0 评论 -
【如何根据电脑配置选择python版本】
根据电脑配置选择Python版本时,需综合考虑操作系统、硬件性能(CPU架构、内存大小)以及使用场景。通过以上步骤,可平衡硬件限制、功能需求及生态兼容性。检测当前环境,再逐步调整。原创 2025-07-07 17:43:51 · 772 阅读 · 0 评论