
Mathematics
文章平均质量分 90
记录数学知识,形成自己体系
阿正的梦工坊
岁月不饶人,我亦未曾饶过岁月
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
利用T检验挖掘文化差异特征:从统计方法到实际应用
独立样本T检验是一种用于比较两个独立群体均值是否存在显著差异的统计方法。原创 2025-06-15 18:21:37 · 1233 阅读 · 0 评论 -
置换检验(Permutation Test)与 p 值:从统计学到数据污染检测的桥梁
置换检验是一种非参数统计方法,通过随机打乱数据的标签或顺序,生成一个“随机分布”,从而评估观察到的统计量(例如两组均值差异)是否显著。它的核心思想是:如果样本间的差异是随机的,那么打乱标签后重新计算的统计量应该与原始统计量相似;如果差异显著,则原始统计量在随机分布中会显得“异常”。原创 2025-04-26 15:03:53 · 1630 阅读 · 0 评论 -
JKO方案中的一阶最优性条件与生成框架
一阶最优性条件原创 2025-04-17 20:04:42 · 787 阅读 · 0 评论 -
什么是Jordan–Kinderlehrer–Otto (JKO)方案
JKO方案通过最小化能量和传输成本,定义了一个离散时间下的概率分布演化过程,能够同时捕捉数据的未归一化似然和从噪声到数据的流。原创 2025-04-17 19:23:50 · 385 阅读 · 0 评论 -
什么是Boltzmann分布(玻尔兹曼分布)?
Boltzmann分布的核心思想是将概率与能量联系起来:能量越低的状态,出现的概率越高。原创 2025-04-17 19:12:34 · 2814 阅读 · 0 评论 -
写给计算机系同学的李群与李代数系列博客:李群与李代数入门到进阶
通过6篇博客,从基础概念到复杂应用,系统介绍李群和李代数的理论、推导和应用,适合计算机系研究生学习和理解。原创 2025-04-12 14:23:31 · 1375 阅读 · 0 评论 -
写给计算机系同学的李群与李代数(六):李群与李代数在计算机中的应用
我们将聚焦于李群与李代数如何解决实际问题,涵盖计算机图形学(Computer Graphics)、机器人学(Robotics)和机器学习(Machine Learning)。通过公式推导、具体例子和直观解释,我们将展示这些理论如何转化为高效的算法和优雅的解决方案。原创 2025-04-12 14:18:17 · 1013 阅读 · 0 评论 -
写给计算机系同学的李群与李代数(五):最大阿贝尔子代数与李代数的分解
我们将聚焦于李代数的一个重要子结构——最大阿贝尔子代数(Maximal Abelian Subalgebra, MASA),并探讨它在分解李代数中的作用。原创 2025-04-12 14:10:34 · 1194 阅读 · 0 评论 -
写给计算机系同学的李群与李代数(四):李括号与结构常数
我们将深入探讨李代数的“心脏”——李括号(Lie Bracket),并引入结构常数(Structure Constants),揭示李代数的代数结构。通过公式推导、具体例子和几何解释,我们将展示李括号如何描述变换的非交换性,以及结构常数如何量化李代数的“形状”,为计算机科学中的应用奠定基础。原创 2025-04-12 14:02:13 · 1019 阅读 · 0 评论 -
写给计算机系同学的李群与李代数(三):矩阵指数与李群-李代数对应
我们将聚焦于矩阵指数映射(Matrix Exponential),它是连接李群与李代数的桥梁。通过公式推导、具体例子和几何解释,我们将揭示李代数如何生成李群元素,以及这种对应在计算机科学中的重要性。原创 2025-04-12 13:53:20 · 1110 阅读 · 0 评论 -
写给计算机系同学的李群与李代数(二):李代数的结构——以 so(n) 为例
我们将深入探讨李代数的结构,重点聚焦于特殊正交群 SO(n) 的李代数 so(n),即由反对称矩阵(Skew-Symmetric Matrix)构成的向量空间。我们会通过公式推导、具体例子和几何解释,帮助你理解李代数的代数性质,以及它为何在计算机科学中如此重要。原创 2025-04-11 21:56:11 · 1248 阅读 · 0 评论 -
写给计算机系同学的李群与李代数(一):从旋转矩阵到抽象群
本篇博客将带你从熟悉的旋转矩阵出发,逐步走进李群和李代数的世界,揭开它们的神秘面纱。我们会通过公式、推导和例子,结合几何意义和直观解释,帮助你建立对这些概念的初步认识。原创 2025-04-11 21:39:32 · 1267 阅读 · 0 评论 -
深入理解 黎曼几何(Riemannian geometry):从流形(Manifold)到测地线 (geodesic)
Riemannian 几何用流形 M和度量g描述弯曲空间,切空间定义方向,测地线和指数映射提供“直线”和“导航”。对于常曲率流形如 Poincaré 球和超球面,这些工具让概率建模更贴合数据的内在几何。原创 2025-04-09 22:45:57 · 844 阅读 · 0 评论 -
Riemannian continuous normalizing flows的背景知识:什么是常曲率流形?从Poincaré盘(庞加莱圆盘)到球面
流形的关键在于,它有自己的几何规则(比如如何定义距离和方向),这些规则由“度量”(metric)决定。而“常曲率流形”是指曲率在整个流形上都一样的特殊流形。曲率是什么?可以理解为空间“弯曲程度”的度量,类似你在不同表面上滚小球时感受到的阻力变化。原创 2025-04-09 21:11:51 · 1025 阅读 · 0 评论 -
连续性方程(Continuity Equation):Flow流模型(CNF)图像生成任务背景下的含义
这篇博客将面向对概率密度变换感兴趣的深度学习研究者,详细介绍方程的来源、意义,以及它们在深度学习中的潜在应用。原创 2025-04-07 17:03:17 · 1154 阅读 · 0 评论 -
瞬时变化率公式推导:从连续性方程到CNF的概率密度计算
在这篇博客中,我将为你详细推导它的来源,并解释它在CNF中的作用。原创 2025-04-07 16:47:34 · 704 阅读 · 0 评论 -
“伴随敏感性方法”(Adjoint Sensitivity Method):“连续时间的反向传播”
核心思想是通过引入一个“伴随变量”(adjoint variable),将目标函数对中间状态的敏感性转化为一个新的微分方程,从而高效计算梯度。原创 2025-04-03 21:05:21 · 1260 阅读 · 0 评论 -
Fokker-Planck方程:从物理到机器学习
在物理学和概率论中,描述随机过程的演化是一个核心问题。“Fokker-Planck方程”(Fokker–Planck Equation)是一种强大的工具,用于刻画概率密度随时间变化的动态。原创 2025-04-03 20:47:51 · 1376 阅读 · 0 评论 -
“皮卡存在定理”(Picard’s Existence Theorem):微分方程解的保障
皮卡存在定理(也称为皮卡-林德勒夫定理,Picard-Lindelöf Theorem)是常微分方程(ODE)理论中的一个基础结果。它回答了一个问题:给定一个初值问题(initial value problem),在什么条件下可以保证解的存在性和唯一性?原创 2025-04-03 20:16:16 · 1250 阅读 · 0 评论 -
数学语境下的“Translation”与“Power”及日常词语的数学含义
在数学中,“translation”指的是“平移”,一种几何变换。在数学中,“power”指的是“幂”,表示一个数被自身相乘的次数,用指数表示。原创 2025-04-03 17:26:11 · 715 阅读 · 0 评论 -
矩阵行列式引理(Matrix Determinant Lemma):高效计算行列式的利器
这篇博客将介绍它的定义、应用场景,并详细解析计算复杂度的由来。原创 2025-04-03 17:14:26 · 784 阅读 · 0 评论 -
谱范数(Spectral Norm)和谱归一化(Spectral Normalization):从数学到神经网络
谱范数:矩阵的最大奇异值,衡量其拉伸能力,直接关联到 Lipschitz 常数。谱归一化:通过除以谱范数调整权重矩阵,限制 Lipschitz 常数,通常用幂迭代法高效实现。原创 2025-04-03 16:32:39 · 1255 阅读 · 0 评论 -
Hutchinson迹估计器与俄罗斯轮盘估计器简介
Hutchinson迹估计器:用随机向量高效估计矩阵迹,适合处理高维雅可比矩阵。俄罗斯轮盘估计器:通过随机截断估计无限和,保证无偏性。原创 2025-04-03 15:56:50 · 680 阅读 · 0 评论 -
理解数学中的“收缩性”(contractive)和“Lipschitz连续性”(Lipschitz continuity)
什么是“收缩性”(Contractive)? Lipschitz连续性与Lipschitz常数原创 2025-04-03 15:41:41 · 587 阅读 · 0 评论 -
什么是“diffeomorphisms”(微分同胚)?从数学到深度学习的视角
今天,我们就来聊聊什么是微分同胚,为什么它在正态化流中如此重要,以及它的数学定义。原创 2025-03-31 20:21:31 · 1486 阅读 · 0 评论 -
什么是互信息(Mutual Information, MI)?互信息与 InfoNCE Loss:对比学习的深层联系
数学原理原创 2025-03-29 20:07:00 · 1397 阅读 · 0 评论 -
Gumbel 噪声与 Gumbel-Softmax 松弛:从离散到连续的桥梁
Gumbel 噪声和 Gumbel-Softmax 松弛是深度学习中处理离散变量的强大工具。Gumbel 噪声利用极值分布的特性模拟最大值选择,而 Gumbel-Softmax 通过平滑化离散采样,解决了不可导问题。它们在 VAE、强化学习和多模态生成(如文本到图像)中有着广泛应用。原创 2025-03-26 15:41:03 · 1193 阅读 · 0 评论 -
Logit-Laplace 分布:解决图像生成中像素值范围匹配问题的创新分布
Logit-Laplace 分布通过将 Laplace 分布的鲁棒性与 logit 变换的范围约束相结合,解决了传统 Gaussian 和 Laplace 分布支持域与像素值范围不匹配的问题。其支持域 (0, 1) 天然适配归一化像素值,避免了似然浪费和无效生成,同时保留了对异常值的鲁棒性。原创 2025-03-26 15:32:23 · 905 阅读 · 0 评论 -
Categorical分布(分类分布):深度学习中的离散建模利器
本文将深入探讨Categorical分布的数学定义、通俗解释,以及它在深度学习中的应用场景,特别是结合VQ-VAE的背景,剖析其为何在此类模型中扮演关键角色。原创 2025-03-24 15:50:45 · 1125 阅读 · 0 评论 -
RK-4(四阶 Runge-Kutta 方法):更精确的 ODE 求解利器
在每步内计算四个斜率,综合预测下一步的值,比 Euler 方法更精确。它的四阶精度使其成为 ODE 求解的常用工具,尤其适合需要高精度的场景。原创 2025-03-09 17:06:33 · 1682 阅读 · 0 评论 -
Euler 方法:解 ODE 的简单利器
本篇博客将面向深度学习研究者,介绍 Euler 方法的原理、推导及其应用,并提供 Python 代码实现,帮助你在实践中快速上手。原创 2025-03-09 16:55:31 · 1590 阅读 · 0 评论 -
什么是自相关函数(Autocorrelation Function)?从直觉到扩散模型中的推导
自相关函数(Autocorrelation Function)是信号处理和随机过程中的一个工具,用来衡量一个随机信号(或随机过程)在不同时间点之间的相似性。原创 2025-03-09 15:16:21 · 1169 阅读 · 0 评论 -
伊藤积分(Ito Integral):随机世界中的积分魔法
本篇博客将以直观的语言,面向具有一定数学和深度学习背景的读者,介绍伊藤积分的定义、特点及其在随机建模中的意义。原创 2025-03-08 20:57:13 · 1829 阅读 · 0 评论 -
布朗运动(Brownian Motion):随机世界的舞者
布朗运动最初由植物学家罗伯特·布朗(Robert Brown)在 1827 年观察到:悬浮在水中的花粉颗粒会无规则地运动。后来,爱因斯坦在 1905 年用统计物理学解释了这一现象,认为它是水分子随机碰撞的结果。数学上,布朗运动被定义为一种连续时间的随机过程,通常记作 (WtW(t)Wt) 或 (BtB(t)Bt),也称为维纳过程(Wiener Process)。简单来说,布朗运动就像一个“醉汉走路”:每一步的方向和距离都是随机的,路径看起来杂乱无章,但在统计上却有规律可循。布朗运动 (W。原创 2025-03-08 20:49:33 · 2505 阅读 · 0 评论 -
微分方程家族:常微分方程(ODE)、偏微分方程(PDE)和随机微分方程(SDE)
本篇博客将以直观的语言,面向具有一定数学基础的读者,介绍常微分方程(ODE)、偏微分方程(PDE)和随机微分方程(SDE)的基本概念,并简述数学系研究微分方程的主要方向。原创 2025-03-08 20:06:27 · 2364 阅读 · 0 评论 -
从离散迭代到连续 常微分方程(Ordinary Differential Equation, ODE):梯度流
本篇博客将面向具有大模型理论基础的研究者,以梯度下降为例,介绍 ODE 的概念、其与离散算法的联系,以及分析梯度流的价值。原创 2025-03-08 19:27:32 · 1127 阅读 · 0 评论 -
模拟退火算法(Simulated Annealing):从物理学到优化的经典方法
当目标函数有多个局部最优解时(如旅行商问题 TSP、函数优化),梯度下降容易卡在局部极值,而模拟退火能跳出这些陷阱。原创 2025-03-08 16:41:54 · 1202 阅读 · 0 评论 -
什么是奇异值(Singular Value)和奇异值分解(SVD)?代码示例
原理介绍原创 2025-03-07 14:21:17 · 1342 阅读 · 0 评论 -
什么是倒挂累积分布函数(Inverting the Cumulative Distribution Function, CDF)?
数学推导和原理介绍原创 2025-03-07 13:44:42 · 671 阅读 · 0 评论 -
Hessian 矩阵的正定性与目标函数凸性的证明
Hessian 矩阵的正定性通过二阶泰勒展开和凸性定义证明了目标函数的凸性。这是优化理论的核心结果,在深度学习中用于分析损失函数的性质和训练稳定性。原创 2025-03-04 13:40:24 · 1391 阅读 · 0 评论