自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 初探Langevin dynamics(朗之万动力学)

数学上:一个带噪声的 SDE算法上:加噪声的梯度下降统计上:一种 MCMC 采样方法Diffusion 中:反向过程的原型。

2025-12-17 21:42:26 672

原创 怎么理解随机微分方程SDE

dWtdW_tdWt​SDE = “确定性动力学 + 连续时间随机噪声”描述的是轨迹是随机的,但分布是可控的适合建模:噪声、扰动、不确定环境是 Kalman、轨迹预测、连续控制、金融模型的数学底座。

2025-12-17 12:08:48 719

原创 简说IRL(一)-逆强化学习概念

摘要: 逆强化学习(IRL)是一种从专家行为数据中反推潜在奖励函数的方法,解决了传统强化学习中手动设计奖励函数的难题。其核心假设是专家行为在某种奖励函数下最优。经典方法包括最大边际法和最大熵IRL,后者通过最大化熵处理不确定性。深度学习扩展了IRL能力,如DeepIRL和GAIL。相比行为克隆,IRL通过学得奖励函数再训练策略,提升了泛化性和鲁棒性。IRL在自动驾驶、机器人等领域具有广泛应用,优势在于避免人为设计偏差并支持目标迁移。

2025-11-19 16:29:13 805

原创 PID调参实战:Ziegler–Nichols(Z-N)搜索方案全解析

在工业现场,90% 以上的控制回路仍在用 PID。“道理我都懂,可参数怎么整?本文用“博客体”把 Z-N 两套经典方案(开环阶跃法 & 闭环临界振荡法)拆成 5 个动作,并给出 Python 自动化脚本与 Simulink 避坑清单,助你 30 min 内跑完一轮参数自整定。

2025-11-15 16:27:13 1132

原创 简说DDPM

DDPM(扩散概率模型)的核心是前向加噪(FP)和逆向去噪(RP)过程。前向过程通过逐步添加高斯噪声将清晰图像转化为噪声图像,符合Markov链性质。逆向过程则通过神经网络学习去噪分布,目标是最大化原始图像的似然概率。损失函数采用变分下界,通过最小化KL散度使网络在未知原始图像时仍能估计噪声分布。关键步骤是优化逆向过程中的后验概率,最终实现从噪声中重建清晰图像。

2025-08-30 18:22:06 914

原创 基本概念-变分下界(ELBO)

本文介绍了变分下界(ELBO)的基本概念及其应用。首先指出直接优化观测数据的对数似然存在积分不可解的困难,进而引入变分分布近似后验分布,通过Jensen不等式推导出ELBO下界,并证明其与KL散度的关系。关键恒等式表明,当变分分布等于真实后验时,下界达到最紧状态。文章还讨论了ELBO在负对数似然优化、变分自编码器(VAE)中的应用,以及梯度估计的两种主流方法(重参数化和REINFORCE)。附录补充了KL散度和Jensen不等式的基本概念。变分下界通过同时优化参数和变分分布,为处理复杂概率模型提供了有效工具

2025-08-30 12:34:03 1378

原创 轨迹优化方法对比——SNOPT/OSQP

名称类型全称SNOPT非线性规划(NLP)求解器OSQP二次规划(QP)求解器类比维度SNOPTOSQP类似于万能的工程师,什么都能做但做得慢专精的工人,只干线性二次任务但效率超高功能功能强大但重简洁、轻量、专注于QP推荐用法离线高质量轨迹规划在线MPC、快速轨迹修正求解器适合的问题方法类别约束支持实时能力SNOPT非线性规划(NLP)SQP(序列二次规划)非线性约束一般(偏离线)IPOPT非线性规划(NLP)内点法(Interior Point)非线性约束。

2025-08-04 11:41:02 1508

原创 轨迹优化之Altro

Altro学习笔记

2025-08-03 13:01:36 821

原创 极大似然估计和最大后验估计

摘要: 极大似然估计(MLE)和最大后验估计(MAP)是两种参数估计方法。MLE仅最大化观测数据的似然函数$P(D|\theta)$,完全依赖数据,可能过拟合;而MAP引入参数先验分布$P(\theta)$,最大化后验概率$P(\theta|D) \propto P(D|\theta)P(\theta)$,平衡数据与先验知识。当先验为均匀分布时,MAP退化为MLE。MLE属于频率学派,MAP属于贝叶斯学派。选择依据:数据充足时用MLE,有先验信息时用MAP更稳健。例如,二项分布中MLE估计概率为$k/n$,

2025-07-09 16:16:37 629

原创 简说IMM

IMM算法过程摘要 IMM(交互式多模型)算法通过多个模型并行估计目标状态,主要分为三个步骤: 交互(Interact):基于转移概率(p_{ij})和当前模型概率(\mu_i),计算混合概率(\mu_{i|j}),并对状态和协方差进行混合加权,得到各模型的初始估计。 滤波(Filtering): 基于模型参数预测下一时刻状态和协方差; 利用新观测计算残差,更新状态和协方差; 根据残差似然(\Lambda_j)更新模型概率(\mu_j)。 组合(Combination):加权融合各模型输出,得到最终状态估计

2025-05-24 14:04:16 550

原创 【论文点读】GenAD: Generative End-to-End Autonomous Driving——Trajectory Prior Modeling

因为轨迹的每一个点都受前序点的影响,为了更好的还原轨迹,这种特点非常适合使用RNN的结构去建模,所以论文中选用了GRU来对隐空间的点进行时序上的关联。根据论文题目知道,介绍了一种基于【生成式的端到端自动驾驶】方法,也是当下最流行的端到端驾驶方式之一;个人理解:我认为此处其实是将原来传统做法中的各种物理约束,压缩到模型中,同时又符合大量数据统计的分布。关于VAE的基础概念和知识大家可以自己去搜索,这里只说核心的思想以及怎么应用到先验里的。在这里,我们将所有数据中的轨迹,通过VAE可以编码到隐空间。

2025-05-20 16:15:25 984

原创 简说Policy Gradient (1) —— 入门

一个Function。

2025-05-06 16:09:19 861

原创 简说Policy Gradient (2) —— Loss

的重要贡献就是直接通过 Reward(value only)来计算出来Policy提升的。这也就是我们在很多时候看到在进行Policy优化的时候,都会计算。再来看下Gradient的形式。这个值的原因,这个值就是。

2025-05-06 14:15:57 954

转载 [Word] Word里指定打印的页码范围

【转载】概要本文介绍如何打印具有多个节而各节中又有各自独立的顺序页码的文档的指定部分。 在Word里你可以创建具有各自独立顺序页码的多节文档。打印时如果要打印特定的页码范围, 必须提供要打印的页码范围的页和节。 在多节文档中,如果你不提供节号,Word就无法确定你要打印哪个“第一页”。打印跨节的页面范围如果要打印的页面范围跨节, 在“打印”对话框中的“页码范围中”中使用下面的语法: p

2016-05-11 09:00:42 4538

原创 [VS 调试] VS 2015调试时提示,该模块应包含一个程序集清单

问题描述在VS2015 调试程序时,编译正常,调试时提示:该模块应包含一个程序集清单解决方法1. 在"解决方案资源管理器"里,右击项目名->属性->调试,勾掉"启用Visual Studio 宿主进程",使其不被选中. 这样再运行程序就可以了.或者 2. 右键“程序集”-属性-调试-启用调试器-启用vs承载进程(取消选择),即可。 本人的Visual Studio 安装不完整,

2016-05-09 11:30:25 8478

原创 [VS+OpenCV] 程序运行过程正常,当跳出函数是出现断言错误

问题描述在VS2015下配置好Opencv后,成勋在函数运行过程中正常,调试时发现,当运行至跳出函数是,出现断言错误。如图原因分析单步跟踪调试发现,在函数结束时会进行vector的析构,出现了析构错误。并且,如果vector在定义完成之后,进行resize或reserve操作,将vector空间做大,问题消失。后来查阅资料,结合亲身测试,发现是在调用Opencv 库时,由于opencv库编译使用的

2016-05-09 11:25:21 4063

转载 【servfox】Arm-linux下USB摄像头的视频服务器的实现

我使用的是webcom 001 的摄像头,它的控制芯片是zc301,以这款芯片做的摄像头在市场上占有率很高,大概有70%左右。开发板的内核是Linux2.6.18,交叉编译器是arm-linux-gcc 3.4.1。配置一下内核,在内核目录下make menuconfig,在Device driver->Multimedia devices->Video4Linux,将它编译进内核,使系统

2015-12-15 11:08:24 934

原创 MFC slider拖动事件响应

在使用MFC的slider control时,对于其拖动的默认响应函数OnCustomdrawSlider,会响应有关draw的事件,包括非操作区的变换导致的界面重绘。而有的时候我们希望只响应对slider的拖动事件,而不响应其他事件。如在制作自定义视频播放器的进度条时,我们希望鼠标在拖动slider时,不允许其他的线程或程序操作这个slider以免造成拖动失败。看了其他网友有关“判断

2015-06-14 18:58:54 10746

原创 MFC 对话框ID改变导致类与框架View脱连的修复

近日在用Visual Studio 编辑MFC程序时,发现以下两个问题:用MFC Class Wizard时,选择某个类后Wizard对话框闪关,导致无法通过类向导来操作类。在给Dialog上的控件添加变量时,右击→添加变量,然后只是等待无反应,重复操作无反应。如下图:在网上搜索第二个问题时,发现有人也出现了这种问题,然后就找到有网友说是由于ID改变

2015-06-14 14:44:40 1480

原创 关于VS 中添加OpenCV 使用配置问题(版本号原因)

在使用VS2010或其他版本时,同时要配置OpenCV,容易出现配置问题,配置方法可以参见网上很多资料,这一篇就很不错。http://blog.youkuaiyun.com/dujian996099665/article/details/8830146这里主要解决一下编译时提示1>LINK : fatal error LNK1104: 无法打开文件“opencv_contrib244d.lib”的

2015-01-23 11:28:23 1184

原创 c++调用静态方法

在使用qt的时候,编程风格都是基于C++的,现在要实现一个定时器的功能,即:当事件A发生,开启定时器,以固定时间计时。当定时器时间到了之后,在触发事件B中关闭定时器。在这期间,有可能A事件又发生一次,则计时器重新计时。这个功能可以用到具有检测功能的需求中。如:A事件为需要连续重复执行的事件,但需要检测当A事件在执行一次之后,如果在规定时间内没有执行事件A,则执行事件C。实现方法:使用QT库

2014-12-19 18:51:37 3180

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除