探寻·轨迹优化论文 — Trajectory Bundle Method

1. 引子

在轨迹优化领域,序列凸优化 (Sequential Convex Programming, SCP) 是解决非凸最优控制问题的主流方法

这类算法的核心思想是:在当前参考轨迹附近对非线性动力学和约束进行线性化近似,从而迭代求解凸优化问题,最终收敛到最优解

然而,这种方法有一个关键前提:动力学模型必须是光滑且可微的

在复杂系统中(例如高保真仿真、气动-推进耦合动力学、或神经网络建模的黑箱模型),模型往往不具备解析可导形式/或是计算开销大,这使得传统的 SCP 难以直接应用

为此,作者提出了一种新的思路

Trajectory Bundle Method (TBM) —— 一种在无导数、采样驱动的框架下实现轨迹优化的方法

Trajectory Bundle Method的目标:融合 SCP 的收敛稳定性与采样优化的灵活性,在不依赖显式导数的情况下,实现了对复杂轨迹优化问题的高效求解

在这里插入图片描述

文章:The Trajectory Bundle Method: Unifying Sequential-Convex Programming and Sampling-Based Trajectory Optimization

链接:https://arxiv.org/abs/2509.26575

2. 核心思路

论文考虑如下的轨迹优化问题:

min ⁡ x ( 1 : N ) , u ( 1 : N − 2 )    ∥ r N ( x ( N ) ) ∥ 2 2 + ∑ k = 1 N − 1 ∥ r k ( x ( k ) , u ( k ) ) ∥ 2 2 s . t .      x ( k + 1 ) = f ( x ( k ) , u ( k ) )              c ( x ( k ) , u ( k ) ) ⩾ 0 \begin{array}{l} \underset{x^{\left( 1:N \right)},u^{\left( 1:N-2 \right)}}{\min}\,\,\left\| r_N\left( x^{\left( N \right)} \right) \right\| _{2}^{2}+\sum_{k=1}^{N-1}{\left\| r_k\left( x^{\left( k \right)},u^{\left( k \right)} \right) \right\| _{2}^{2}}\\ \mathrm{s}.\mathrm{t}.\,\,\,\,x^{\left( k+1 \right)}=f\left( x^{\left( k \right)},u^{\left( k \right)} \right)\\ \,\,\,\,\,\,\,\,\,\,\,\,c\left( x^{\left( k \right)},u^{\left( k \right)} \right) \geqslant 0\\ \end{array} x(1:N),u(1:N2)min rN(x(N)) 22+k=1N1 rk(x(k),u(k)) 22s.t.x(k+1)=f(x(k),u(k))c(x(k),u(k))0

在传统的 SCP 算法中,会在当前轨迹 ( x ˉ ( k ) , u ˉ ( k ) ) \left( \bar{x}^{\left( k \right)},\bar{u}^{\left( k \right)} \right) (xˉ(k),uˉ(k)) 处线性化,具体参考SCvx博文

f ( x ( k ) , u ( k ) ) ≈ f ( x ˉ ( k ) , u ˉ ( k ) ) + A ( k ) ( x ( k ) − x ˉ ( k ) ) + B ( k ) ( u ( k ) − u ˉ ( k ) ) f\left( x^{\left( k \right)},u^{\left( k \right)} \right) \approx f\left( \bar{x}^{\left( k \right)},\bar{u}^{\left( k \right)} \right) +A^{\left( k \right)}\left( x^{\left( k \right)}-\bar{x}^{\left( k \right)} \right) +B

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值