手把手教你：MPC控制器设计

原创已于 2025-09-11 10:41:25 修改 · 1k 阅读

19 ·

CC 4.0 BY-SA版权

文章标签：

#模型预测控制 #MPC #控制算法

于 2025-09-11 10:19:31 首次发布

控制论同时被 3 个专栏收录

30 篇文章

订阅专栏

模型预测控制

2 篇文章

订阅专栏

MPC

2 篇文章

订阅专栏

本文将带你深入浅出地理解MPC的核心思想，并手把手教你如何为一个常见的电路系统（一阶RL系统，其模型为 1/(L*s + R)）设计一个MPC控制器。：

我们的旅程分为两部分：

思想篇：MPC的核心思想——像老司机一样开车
实践篇：为 1/(Ls+R) 系统设计MPC控制器

第一部分：思想篇 — MPC的核心思想：像老司机一样开车

想象一下你在开车，你的目标是让车在道路中央平稳行驶。

PID控制（普通司机）： 他只盯着当前的车轮和道路中心的偏差。偏左了就向右打方向，偏右了就向左打方向。他反应很快，但只基于“当前这一刻”的信息，不会提前思考。如果前面有个急弯，他可能就会手忙脚乱。
MPC控制（老司机）： 老司机不一样！他的大脑一直在做一件事：
1. 预测未来： 他的眼睛不仅看现在，更看向远方。他根据当前车速、方向盘角度和对前方道路的认知，在心里模拟出未来几秒钟车的行驶轨迹。“如果我保持这个方向不动，10秒后会开到哪里去？”“如果我方向盘打10度，轨迹又会是怎么样的？”
2. 优化决策： 他在心里比较无数种可能的操作（打多少方向、踩多少油门），然后选择一个最优的系列操作。这个“最优”的标准是：既要保持车辆在道路中央，又要行驶平稳（方向盘不能打得太猛），还要省油。
3. 执行并重复： 他只实施这一系列操作中的第一步（比如，轻轻向右打一点方向）。然后，车移动到了下一个位置，他立刻再次重复“预测-优化”这个过程。因为世界是变化的，他看到了更远的路况，有了更新的车辆信息，所以每次决策都是基于最新的情况。

这就是MPC（模型预测控制）的核心思想：

利用一个模型（Model） 来预测（Predictive） 系统未来的行为。
通过求解一个优化问题，来计算未来一系列控制动作，以使预测的未来行为尽可能好（控制）。
只实施第一步的控制动作，然后到下一个时刻，基于新的测量值重新进行预测和优化（滚动优化，Receding Horizon）。

三个关键词：模型预测、滚动优化、反馈校正。

第二部分：实践篇 — 为 `G(s) = 1/(Ls + R)` 设计MPC控制器

现在我们以一個简单的RL电路为例，其传递函数是 G(s) = I(s) / V(s) = 1 / (L*s + R)。

V：输入电压（我们的控制量，u）
I：输出电流（我们想控制的被控量，y）
L：电感
R：电阻

我们的控制目标： 让我们电路的电流 I 快速地、平稳地跟踪一个我们期望的电流值 I_ref（比如，突然从0A上升到1A）。

设计步骤一览

离散化系统模型（MPC的“M”）
设定预测时域和控制时域
构建预测方程
定义优化问题
求解优化问题并实施控制

步骤 1: 离散化系统模型 — 给老司机的“车辆动力学模型”

MPC是数字算法，需要在计算机里运行，所以我们必须把连续的物理模型变成离散的差分方程。

连续状态空间方程（来自传递函数）：
𝑑𝑖/𝑑𝑡 = (-R/L) * i + (1/L) * V

我们用一个非常简单的离散化方法（前向欧拉法），采样时间为 Ts：
(i[k+1] - i[k]) / Ts ≈ (-R/L) * i[k] + (1/L) * V[k]

整理后，得到我们的预测模型：
i[k+1] = (1 - (R*Ts)/L) * i[k] + (Ts/L) * V[k]

为了看起来更简洁，我们定义：
a = (1 - (R*Ts)/L)
b = (Ts/L)

于是，核心模型变为：
i[k+1] = a * i[k] + b * V[k]
这个方程就是老司机大脑里的“车辆模型”，他知道如果当前电流是 i[k]，我施加一个电压 V[k]，那么下一刻的电流一定会是 i[k+1]。

步骤 2: 设定预测时域 — 老司机看多远？

老司机会预测未来多少步？我们需要定义两个参数：

预测时域 (Np)： 预测未来多少步。Np=10 表示预测未来10个采样时刻。
控制时域 (Nc)： 决定未来多少步的控制量可以改变。通常 Nc <= Np。Nc=3 表示我们只计算未来3步的最佳电压值，3步之后，我们假设控制量保持不变。

（为了让例子简单，我们假设 Nc = Np）

步骤 3: 构建预测方程 — 老司机在心里模拟未来

假设当前时刻是 k，我们已知当前测量到的电流 i[k]。
我们想预测未来 Np 步的电流 i[k+1|k], i[k+2|k], ..., i[k+Np|k]。（k+1|k 表示在k时刻预测k+1时刻）

利用我们的模型，不断迭代：

i[k+1|k] = a * i[k] + b * V[k|k] (V[k|k]是待求的k时刻控制量)
i[k+2|k] = a * i[k+1|k] + b * V[k+1|k] = a*(a*i[k] + b*V[k|k]) + b*V[k+1|k] = a²*i[k] + a*b*V[k|k] + b*V[k+1|k]
i[k+3|k] = a³*i[k] + a²*b*V[k|k] + a*b*V[k+1|k] + b*V[k+2|k]
...
i[k+Np|k] = a^{Np} * i[k] + a^{Np-1}*b * V[k|k] + ... + b * V[k+Np-1|k]

我们可以把这些未来预测全部写成一个巨大的矩阵方程：
Y = F * i[k] + Φ * U

其中：

Y = [i[k+1|k], i[k+2|k], ..., i[k+Np|k]]^T (预测的输出向量)
U = [V[k|k], V[k+1|k], ..., V[k+Np-1|k]]^T (待优化的控制向量)
F = [a, a², a³, ..., a^{Np}]^T

Φ 是一个 Np x Np 的下三角矩阵，元素是 a, b 的组合：

[ b,       0,       0, ..., 0 ]
[ a*b,     b,       0, ..., 0 ]
[ a²*b,    a*b,     b, ..., 0 ]
[ ...                         ]
[ a^{Np-1}*b, ...,     ..., b ]

这个方程就是老司机的“预测引擎”。给定一组未来的控制动作 U，他就能算出未来所有的车辆轨迹 Y。

步骤 4: 定义优化问题 — 老司机的“择最优标准”

我们的目标是最小化跟踪误差，同时控制动作不能太剧烈。我们把它写成一个数学优化问题：

Minimize J = (Y - Y_ref)^T * Q * (Y - Y_ref) + U^T * R * U

Y_ref：未来参考轨迹向量，通常就是 [I_ref, I_ref, ..., I_ref]^T。
Q：输出误差的权重矩阵。Q 越大，表示我们越希望紧紧跟踪目标。
R：控制量的权重矩阵。R 越大，表示我们越希望控制动作平滑、省能量。

这个代价函数 J 的两部分正好对应了老司机的两个目标：跑在路中央 和 开车要平稳。

步骤 5: 求解优化问题并实施控制 — 老司机做决定并执行

现在，我们把预测方程 Y = F * i[k] + Φ * U 代入代价函数 J。

经过一些数学推导（二次规划，Quadratic Programming），上面的优化问题可以转化为一个标准的二次型优化问题：

Minimize J = 1/2 * U^T * H * U + f^T * U (省略常数项)

其中：

H = 2 * (Φ^T * Q * Φ + R) （Hessian矩阵，必须正定）
f^T = 2 * ( (F*i[k] - Y_ref)^T * Q * Φ )

求解这个二次规划问题，就能得到未来一系列最优的控制序列 U* = [V*[k], V*[k+1], ..., V*[k+Np-1]]。

MPC的精髓——滚动优化：
我们只取这个最优序列的第一个值 V*[k] 来实际驱动我们的电路。
到了下一个采样时刻 k+1，我们测量到新的电流值 i[k+1]，然后完全重复整个步骤3-5：基于新的测量值重新预测、重新优化。

这样，每当有新的信息（测量值）进来，我们都会重新计算最优路径，使得控制器能够处理模型误差和未知干扰。

总结与工程实践

设计流程回顾：

建模与离散化： 得到 i[k+1] = a*i[k] + b*V[k]。
确定参数： 选择采样时间 Ts、预测步长 Np、控制步长 Nc、权重 Q 和 R。
离线构建矩阵： 计算好 F 和 Φ 矩阵，以及 H 和 f 的表达式。
在线滚动优化：
- 在每个采样时刻 k，测量当前输出 i[k]。
- 构建当前的优化问题（计算 f）。
- 调用QP求解器（如qpOASES， CVXGEN， MATLAB的quadprog）求解得到 U*。
- 应用 u(k) = V*[k] 到真实系统。
- k = k+1，重复。

工程实践提示：

调参： Np 越大，预见性越好，但计算量越大。Q 和 R 是主要的调节参数，增大 Q 跟踪更快但控制可能更剧烈；增大 R 控制更平滑但跟踪可能变慢。
约束： MPC最大的优势是可以直接处理约束！比如，电压源有上限 V_min <= V <= V_max，电流有安全上限 I <= I_max。这些约束可以直接加到优化问题里（U_min <= U <= U_max），求解器会自然满足它们。这是PID无法简单做到的。
计算能力： MPC的计算量比PID大得多，需要选择性能足够的处理器（如DSP、高端MCU）。
模型精度： 模型的准确性至关重要。如果模型 a, b 不准，预测就会不准，控制性能会下降。对于 1/(Ls+R)，我们可以通过测量较精确地得到 L 和 R。