一碗姜汤-优快云博客

原创 LS性能边界、QR分解、RLS自适应

只有上三角不为零，所以事实上我只关心如何把下头的部分变为零。全部搞成零，采取的策略是 GIvens 旋转（因为Householder列消除的方式会造成大面积浪费）然而，第二个分量和滤波器系数没有一毛钱关系，这一部分残差就是最小二乘的性能边界（一方面取决于目标。在处理第二列的时候，我其实并不关心第一个元素，因为第二列第一个元素经过反射后处于。下面我们谈QR分解的线性代数技术，这有助于我们构造全新的自适应方法。正交变换是刚体变换的一种，而刚体变换就三种类型：平移、我们的目标是找到一个能够把数据矩阵。

2025-12-23 21:31:54 408

原创【自适应滤波】LMS算法

在变，这使得我们在某一时刻迭代太多次数的意义并不大。自适应这种思想在信号处理当中占据很特殊的地位，因为我们所处理的信号多数情况下都假设具有。的期望并不好做，本质原因还是源于场景的非平稳特性。，这需要对步长提出新的要求，详情见Haykin的书，这里不做过多说明。，而平稳性在现实当中是很难存在的。因此在不平稳的情况下，我们希望在。原则上讲是不独立的，所以期望无法拆开。决定了迭代搜索的方向，而我们希望朝着使。我们还要解决怎么把矩阵转化成数的问题，现在我们需要处理的是一个变化的环境（值得注意的是，我们还需要一个。

2025-12-20 20:36:08 860

原创 GaRe：面向非约束户外照片集的可重光照 3D 高斯溅射技术简要解析

没错，有直接的阳光，有天空的漫反射，还有物体之间互相反射形成的间接光。这些光照在物体上，再结合物体自身的材质，就形成了我们看到的图像。由于高斯表示的几何精度有限，直接光线追踪可能出现误差：比如天空中“浮动的高斯”会错误遮挡地面高斯，动态物体的“瞬态高斯”会导致不同视角的可见性不一致。什么是“仅环境光”？这个方法避免了传统3D建模的复杂性，纯图像域的操作更高效，且能捕捉到细微的光影边界，为后续真实的重新照明打下基础。阳光是很强的直射光，它的照射范围是有限的，只有被阳光直接照到的地方才会受到它的影响。

2025-08-31 23:10:04 1161

原创 windows11安装WSL过程

期间我第一次wsl --install完了以后重启，但是wsl存在闪退的问题，通过上述重装了以后才成功。✳️ 步骤 1：确认 WSL 所需组件都启用了。

2025-06-29 21:56:33 255

原创认识Jacobian

若有一个从欧式空间。

2025-06-26 16:36:26 1300

原创刚入门3DGS的新手小白能够做的工作

3DGS是一个快速发展的领域，保持对新技术（如动态高斯、多模态图元）的关注，逐步积累经验即可进阶！

2025-05-25 13:33:18 1636

原创人脑能够通过视频信息快速建模出现实场景，原因有哪些方面？

人脑通过视频信息快速建模现实场景的能力，是数百万年生物进化与认知机制协同优化的结果。，而非单纯模仿神经元连接形式。例如，借鉴人脑的“运动-结构”快速解算机制，可能是突破动态重建实时性瓶颈的关键。这些特性为计算机视觉提供了启示：未来算法需融合。人脑的场景建模能力本质上是。

2025-05-25 11:47:42 823

原创详解3DGS

自适应密度控制优化是3D高斯 splatting 的核心创新之一，通过“优化-密度控制-渲染”的闭环，实现了几何细节的自适应建模与计算资源的高效分配。该方法在保持高重建质量的同时，将训练时间和渲染延迟压缩至实时水平，为大规模场景的实时神经渲染提供了新范式（文档结论部分）。快速可微分光栅化器是3D高斯 splatting 实现“实时渲染”的核心引擎，通过瓦片划分-排序-混合的流水线设计，结合GPU并行计算和可微分技术，在保证高渲染质量的同时，将训练和推理速度提升至传统NeRF方法的数十倍。

2025-05-25 11:46:35 1588

原创【统计学习】递归最小二乘算法与奇异值分解

这篇文章讲关于自适应算法的又一个认识：递归最小二乘（Recursive Least Square）假设有一组数据（在不同时刻）：x(1),x(2),...,x(n)x(1),x(2),...,x(n)x(1),x(2),...,x(n)在每一时刻有不同的目标：d(1),d(2),...,d(n)d(1),d(2),...,d(n)d(1),d(2),...,d(n)我们打算用数据对目标进行估计/预测/逼近。也就是找到一种变换，使得数据经过变换之后能够逼近目标：g(x(n))→d(n)g(x(n))\to d

2025-04-25 14:46:19 1054

原创【深度学习】花书第18章——配分函数

许多概率模型（通常是无向图模型）由一个未归一化的概率分布 p~(x,θ)\tilde p(\mathbf x,\theta)p~(x,θ)定义。我们必须通过除以配分函数Z(θ)Z(\pmb{ \theta})Z(θ)来归一化p~\tilde pp~。以获得一个有效的概率分布：p(x,θ)=1Z(θ)p~(x,θ)p(\mathbf x,\pmb \theta)=\frac{1}{Z(\pmb \theta)}\tilde p(\mathbf x,\theta)p(x,θ)=Z(θ)1p~(x,θ)

2025-04-13 18:43:28 1241

原创【胶囊网络】完美复现Hinton论文99.23%

我之前在2024-07-15的时候实现过一版胶囊网络，但是当时无论我怎么训练，都没办法达到Hinton论文里的99.23%（MNIST扩展数据集上）：前两天心血来潮，又认真读了一下Hinton论文，严格按照论文要求进行复现：最终达到了Hinton里的性能上限，同时训练速度也比以往那版要快大概五六倍。

2025-03-15 11:20:47 382

原创【深度强化学习】不完全观测问题

将卷积层、全连接层与循环层结合，这样就能处理不固定长度的输入了。为从初始到t时刻为止的观测。

2025-02-19 15:49:13 382

原创【深度强化学习】置信域策略优化（TRPO）

置信域方法是数值优化领域中的一类经典算法。是一种策略学习方法，巧妙地结合了置信域的迭代优化方法——对目标函数做了一个方便迭代的。，以及基于该策略的对当前状态的每一个动作的未来期望回报函数——，当一个策略的马尔可夫链运行达到稳态的时候，会有一个。是一个需要调整的超参数。至此，TRPO的思想讲完了。，那么一个策略越好，它的状态价值函数的期望——，我们就可以得到，能够计算出当前状态价值的。逐次迭代即可实现对一个复杂目标的优化。生成的轨迹，是对策略分布的近似。一定越大，所以策略学习的。

2025-02-18 22:44:50 673

原创【深度强化学习】Actor-Critic 算法

本书之前的章节讲解了基于值函数的方法（DQN）和基于策略的方法（REINFORCE），其中基于值函数的方法只学习一个价值函数，而基于策略的方法只学习一个策略函数。那么，一个很自然的问题是，有没有什么方法既学习价值函数，又学习策略函数呢？答案就是 Actor-Critic。Actor-Critic 是囊括一系列算法的整体架构，目前很多高效的前沿算法都属于 Actor-Critic 算法，本章接下来将会介绍一种最简单的 Actor-Critic 算法。需要明确的是，Actor-Critic 算法本质上是基于策

2025-02-15 13:56:40 1135

原创【深度强化学习】策略梯度算法：REINFORCE

REINFORCE 算法是策略梯度乃至强化学习的典型代表，智能体根据当前策略直接和环境交互，通过采样得到的轨迹数据直接计算出策略参数的梯度，进而更新当前策略，使其向最大化策略期望回报的目标靠近。这种学习方式是典型的从交互中学习，并且其优化的目标（即策略期望回报）正是最终所使用策略的性能，这比基于价值的强化学习算法的优化目标（一般是时序差分误差的最小化）要更加直接。它的含义是，目标函数的梯度可以通过对所有状态和动作的加权求和来近似，权重是状态的稳态分布和状态 - 动作值函数。，可以用多种方式对它进行估计。

2025-02-14 22:34:39 1455

原创【深度学习】一文搞懂DDPM+代码实现

这个方法最早出现在2015年，知道2019年,OpenAI才把这个方法用到了图像生成领域。人们才发现这真的是个宝。我们拿画一幅画做例子。一般人画画都是先画一个草图，然后逐渐上颜色，然后填充细节，然后上颜色，然后不断修饰，不断润色，直至画稿完成。计算机绝不是这么画的。计算机的画画是好比我们打算画一个人，计算机会拿到关于这个人不同的照片，计算机认为这些不同的照片是从这个人分布中采样出来的一个个样本。而不同的人分布自然也不尽相同，就好比你的眉毛眼睛鼻子的轮廓都和别人不一样。

2025-01-09 18:37:55 1245

原创 LightGBM与GBDT：原理、关系及应用

GBDT（Gradient Boosting Decision Tree）是一种基于Boosting集成学习思想的机器学习算法，用于解决回归和分类问题。它通过将多个弱学习器（通常是决策树）组合成一个强学习器来提高模型的预测能力。其基本思想是迭代地训练一系列决策树，每棵树都在前面树的残差基础上进行学习。以回归问题为例，假设我们有训练数据集x1y1x2y2⋯xnynx1y1x2y2⋯xnyn，首先初始化一个预测值yi0y。

2025-01-05 16:55:35 1056

原创 Polars库常用用法

Polars是一个用Rust编写的高性能DataFrame库，在Python和R等语言中有接口。在处理大规模数据和复杂的数据处理任务时，Polars 通常具有更好的性能表现，包括更快的数据读取、处理速度和更高效的内存占用。但对于小型数据集和简单的数据操作，Pandas 的易用性和在数据分析领域的广泛应用也使得它仍然是一个不错的选择。可以通过设置参数来指定数据类型、分隔符、是否有表头等。明确指定文件有表头并且分隔符是逗号。

2025-01-05 16:43:21 1211

原创【深度学习系统】Lecture 4 - Automatic Differentiation

可以看到从定义出发，虽然它能够计算任意函数的导数，但是计算机的精度有限，依然存在误差，而且计算效率并不高，因为要对每一个参数都做一遍这样的计算，代价是十分昂贵的。第二代微分方法相比第一代微分方法最大的特点是对计算图进行了扩展，使得新扩展出来的计算图的节点本身就是梯度信息。是一个n维的向量，计算梯度时每一个维度实际上都进行了n-2次的重复计算，这些计算并不能被简单地重用。计算梯度信息会是一个非常频繁的过程，这就牵扯到一个关键的问题——计算的效率。的角度计算函数微分，这样就保证了梯度计算的精确性。

2025-01-04 21:28:41 1347

原创【408】选择易错点总结

知识点回顾：有如下表述是正确的：知识点回顾：有如下表述是正确的：知识点回顾：有如下表述是正确的：知识点回顾：注意题目问的是规格化最值还是非规格化最值：知识点回顾：知识点回顾：知识点回顾：知识点回顾：知识点回顾：知识点回顾：知识点回顾：而GPT的回答是这样的：知识点回顾：知识点回顾：

2024-12-06 12:12:36 378

原创【数一】易忘易错知识点、技巧意识总结

1. 高数导数、极限、连续的性质题（记住反例）极限就是逼近但取不到；连续就是逼近和取到相等；导数本质也是个函数，也以点或区间的形式考察其连续性计算极限的顺序（常数因子能提的先提出来，然后才是洛必达或者等价无穷小）复合函数微分性质（先求出复合函数的形式）祖孙三代的奇偶性与周期性曲率与曲率半径不等式（——添项减项技巧+拉格朗日中值定理）凹凸性的两种定义中值定理常考题型二元函数的二阶泰勒多项式非典型微分方程（换元先行）再比如24年真题：一道求点的轨迹和极坐标球积分的好题。

2024-12-05 19:50:07 1113

原创【计组大题】指令流水线

对于这两条指令之间的数据冒险，在第2条指令的ID段的前半周期，第1条指令已完成对寄存器t的写操作，在第2条指令的 ID 段的后半周期，第2条指令可以从寄存器t中取得正确的值，因此也消除了这两条指令间的数据冒险。注意到，I6后面莫名其妙空出来3个空段，这其实就是硬件阻塞，不可能是软件插入nop指令，因为插入nop指令是插入一条完整的5段流水线执行流程，下面I1/I7那儿的三条阻塞才是软件插入nop指令。通过第（2）问的分析，可以得出使用流水线情况下完成所有任务的时间为10个时钟周期。

2024-12-05 13:42:53 1236

原创【深度学习系统】Lecture 2 - ML Refresher / Softmax Regression

一、问题的理解方式首先，什么是数据驱动的编程？面对经典的MNIST数据集识别任务，传统的编程思维和数据驱动的编程思维有何不同？传统编程思维：通常从明确的问题定义和具体的算法开始。对于 MNIST 数据集识别任务，可能会首先考虑使用特定的图像处理算法，如边缘检测、特征提取等，然后设计一系列的逻辑步骤来对图像进行处理和分类。数据驱动编程思维：更注重对数据本身的理解。会先分析 MNIST 数据集的特点，包括图像的像素分布、数字的特征等。通过对数据的观察和探索，发现数据中的模式和规律，从而决定采用何种

2024-10-15 21:34:53 1205

原创【时频分析 02】Wingner-Ville Transform

我们今天继续学习短时傅里叶变换，看清它的特性和不足。今天要引入新的工具来弥补短时傅里叶变换的不足，尽管它自身也有不足之处（没有缺点的工具是不存在的）。

2024-08-20 23:17:29 1028

原创【大模型01】参数高效微调之LoRA

LoRA通过将原始的高秩矩阵分解为两个低秩矩阵的乘积，实现了参数数量和计算复杂度的显著降低。这种方法特别适合大规模模型的训练和推理，能够在保证模型性能的前提下，提高计算效率和资源利用率。

2024-08-09 10:39:04 1259

原创【深度学习】基于pytorch的胶囊网络实现

动态路由机制讲解：https://www.bilibili.com/video/BV1oW411H7G1/?可以看到从第六个epoch开始，acurracy呈现断崖式增长，但是前期增长却很慢，而且训练速度非常慢。Hinton论文：Dynamic Routing Between Capsules。

2024-08-02 16:29:35 315

原创【时频分析 01】短时傅里叶变换

时频分析（Time-Frequency Analysis）我们对于一个正常的信号X(t)X(t)X(t)，都希望从时域和频域两个角度进行认识。我们的采样通常是在时域上，而频域上的表达就是所谓的傅里叶变换：X^(w)=∫−∞+∞X(t)exp⁡(−jwt)dt\hat X(w)=\int_{-\infty}^{+\infty}X(t)\exp(-jwt)dtX^(w)=∫−∞+∞X(t)exp(−jwt)dt傅里叶变换的结果可以让我们了解这个信号在各个频点上的分量的情况，或者说各个频点上的信号强

2024-08-02 16:24:48 1870

原创【数学分析02】不动点原理

数列的不动点原理（Fixed Point Theorem for Sequences）在数学分析中是一个重要的工具，用于研究数列收敛性的特性。具体来说，一个数列的“不动点”是指某个数列的一个值，当数列收敛时，其极限值就是这个不动点。最常见的不动点原理是巴拿赫不动点定理（Banach Fixed Point Theorem），也称为收缩映射定理。我们想找到这个函数的一个不动点。是一个非空的完备度量空间，并且。是一个收缩映射，即存在一个常数。根据巴拿赫不动点定理，逐渐逼近 1，即数列。

2024-06-12 03:51:23 4404

原创【数学分析01】stolz公式

STOLZ公式是一种用于求极限的数学工具，主要用于研究两个数列的比值极限。希望这个解释对你有帮助！如果你有任何其他问题或需要进一步的例子，请告诉我。，因此无法直接应用STOLZ公式，因为我们得到了一个趋向于无穷大的结果。必须是严格单调增的数列，并且趋向于无穷大。，我们来验证是否可以应用STOLZ公式来求。注意：STOLZ公式的应用前提是。如果我们考虑一个不同的数列，例如。

2024-06-12 03:40:31 1736

原创【强化学习05】从Q学习到深度Q学习

深度Q学习（DQN）通过结合深度神经网络和Q学习，能够在复杂和高维度的状态空间中进行有效的强化学习。关键技术包括经验回放和目标网络，这些技术显著提高了训练的稳定性和效率。尽管面临一些挑战，但DQN在许多强化学习任务中表现出色，特别是在游戏和模拟环境中。

2024-05-28 23:47:34 1389

原创【强化学习04】Q学习时序差分法

在强化学习中，Q值是用来评估在某个状态（state）下执行某个动作（action）所能获得的长期回报（reward）的一个数值。Q值越高，意味着在这个状态下执行这个动作越好。即时奖励rrr：你当前动作带来的直接收益。未来奖励的预期γmax⁡a′Qs′a′γmaxa′Qs′a′：考虑到未来所有可能的状态和动作后的最大收益，但需要折现因子γ\gammaγ来平衡现在和未来的收益。Q值更新：通过即时奖励和未来奖励的结合，不断迭代更新Q值，使其逐步逼近真实的动作价值。

2024-05-28 22:19:13 1392

原创【数理统计03】集中不等式

集中不等式（concentration inequalities）是在概率论和统计学中用于描述随机变量（尤其是随机变量的和或函数）的集中程度的一类不等式。它们为随机变量偏离其期望值的概率提供了上界。这些不等式在很多领域都有应用，包括机器学习、统计学习理论、组合数学和随机过程等。下面介绍几种常见的集中不等式：马尔可夫不等式（Markov’s Inequality）是概率论中的一个基本不等式，用于估计随机变量大于某个正数的概率。它适用于任何非负随机变量，提供了一个简单而有用的上界。下面是马尔可夫不等式的正式陈述

2024-05-27 18:48:47 3080 1

PAT甲级所有题解代码

From Nand to Tetris (I) on Coursera

xthreg2安装包，包含lxthreg.mlib(349kb)、xthreg2.ado(7kb)，实测有效！

《Statistical Methods for Reliability Data》完整数据集

空空如也