【非线性鲁棒控制器_滑模控制学习】_中_小白都能看懂的稳定性证明

1、回顾鲁棒控制器(基础滑模,解释问题在哪里)

系统 x ˙ = f ( x ) + u \dot{x}=f(x)+u x˙=f(x)+u ∣ f ( x ) ∣ < ρ ( x ) |f(x)|<\rho(x) f(x)<ρ(x)

这个系统的特点就是里面含有未知但有界的项f(x)

目标是令 x → x d x\rightarrow x _d xxd,即 e = x d − x e=x_d-x e=xdx, e → 0 e\rightarrow0 e0
e ˙ = x ˙ d − f ( x ) − u ( 1 ) \dot e=\dot x_d-f(x)-u (1) e˙=x˙df(x)u1
令:
u = x ˙ d + k e + ρ ∣ e ∣ e ( 2 ) u=\dot x_d+ke+\rho\frac{|e|}{e} (2) u=x˙d+ke+ρee2
其中, ∣ e ∣ e \frac{|e|}{e} ee 就是符号函数 s g n ( e ) sgn(e) sgn(e),它对应的图形就是一个分段的函数。
这种控制方法就叫做sliding mode (滑模)。
把u带进去:
e ˙ = − k e − f ( x ) − ρ ( x ) ∣ e ∣ e ( 3 ) \dot e=-ke-f(x)-\rho(x) \frac{|e|}{e} (3) e˙=kef(x)ρ(x)ee3
这个式子当中的组成元素,也可以画图。这时候画出来的图横坐标是e,纵坐标是e的导数,这种图叫做相图(phase portrait)。
关于相图的知识,可以看如下链接
相图
通过这个简易的图可以看到,系统是在两个mode中间不停的切换,这也就是为什么这种方法叫做滑模控制
这种来回切换带来的问题,就是控制器的输出的数值大幅度的变化,例如自动驾驶应用中,上一时刻方向盘在8点钟方向,下一时刻就要到4点钟方向,这对执行器非常不友好。
这种问题就是因为符号函数引起的。
既然有问题,那就要解决,就有了改进的空间。

2、改进

还是同一个系统 x ˙ = f ( x ) + u \dot{x}=f(x)+u x˙=f(x)+u ∣ f ( x ) ∣ < ρ ( x ) |f(x)|<\rho(x) f(x)<ρ(x)
目标是令 x → x d x\rightarrow x _d xxd,即 e = x d − x e=x_d-x e=xdx, e → 0 e\rightarrow0 e0
e ˙ = x ˙ d − f ( x ) − u ( 1 ) \dot e=\dot x_d-f(x)-u (1) e˙=x˙df(x)u1
令:
u = x ˙ d + k e + u a u x ( 2 ) u=\dot x_d+ke+u_{aux} (2) u=x˙d+ke+uaux2
aux指的是auxiliary 辅助的

  • 对于基础滑模控制器来说
    u a u x 1 = ρ ∣ e ∣ e u_{aux1}=\rho \frac{|e|}{e} uaux1=ρee
  • 第一种改进策略(High Gain)
    u a u x 2 = 1 ϵ ρ 2 e u_{aux2}=\frac{1}{\epsilon}\rho ^2e uaux2=ϵ1ρ2e ϵ > 0 \epsilon>0 ϵ>0
  • 第二种改进策略 (High Frequency)
    u a u x 3 = ρ 2 e ρ ∣ e ∣ + ϵ u_{aux3}=\frac{\rho ^2e}{\rho|e|+\epsilon} uaux3=ρe+ϵρ2e ϵ > 0 \epsilon>0 ϵ>0

3、 High Gain 原理及稳定性证明

u a u x 2 = 1 ϵ ρ 2 e , ϵ > 0 u_{aux2}=\frac{1}{\epsilon}\rho ^2e, \epsilon>0 uaux2=ϵ1ρ2e,ϵ>0
先来分析一下这个式子,这个式子里面有一个平方项 ρ 2 \rho ^2 ρ2,这个式子整体的含义就是用足够大的输入去抵消不确定性。

  • 稳定性证明 u = x ˙ d + k e + 1 ϵ ρ 2 e u=\dot x_d+ke+\frac{1}{\epsilon}\rho ^2e u=x˙d+ke+ϵ1ρ2e
    V = 1 2 e 2 V=\frac{1}{2}e^2 V=21e2
    V ˙ = e e ˙ = e ( x ˙ d − f ( x ) − k e − x ˙ d − 1 ϵ ρ 2 e ) = − e f ( x ) − k e 2 − 1 ϵ ρ 2 e 2 \dot V=e\dot e=e(\dot x_d-f(x)-ke-\dot x_d-\frac{1}{\epsilon}\rho ^2e)=-ef(x)-ke^2-\frac{1}{\epsilon}\rho^2e^2 V˙=ee˙=e(x˙df(x)kex˙dϵ1ρ2e)=ef(x)ke2ϵ1ρ2e2
    因为 f ( x ) f(x) f(x)是有界的,并且 f ( x ) < ρ f(x)<\rho f(x)<ρ,所以如下不等式成立:
    − e f ( x ) ≤ ∣ e ∣ ∣ f ( x ) ≤ ∣ e ∣ ρ -ef(x)\leq|e||f(x)\leq|e|\rho ef(x)e∣∣f(x)eρ
    下面进行缩放
    V ˙ ≤ ρ ∣ e ∣ − k e 2 − 1 ϵ ρ 2 e 2 = − k e 2 + ρ ∣ e ∣ ( 1 − 1 ϵ ρ ∣ e ∣ ) \dot V\leq \rho| e|-ke^2-\frac{1}{\epsilon}\rho^2e^2=-ke^2+\rho|e|(1-\frac{1}{\epsilon}\rho|e|) V˙ρeke2ϵ1ρ2e2=ke2+ρe(1ϵ1ρe)

Case1: ρ ∣ e ∣ > ϵ \rho|e|>\epsilon ρe>ϵ

这个时候 1 ϵ ρ ∣ e ∣ > 1 \frac{1}{\epsilon}\rho|e|>1 ϵ1ρe>1,移项得到 1 − 1 ϵ ρ ∣ e ∣ < 0 1-\frac{1}{\epsilon}\rho|e|<0 1ϵ1ρe<0,等式两边同时乘 ρ ∣ e ∣ \rho|e| ρe,就可以得到 ρ ∣ e ∣ ( 1 − 1 ϵ ρ ∣ e ∣ ) < 0 \rho|e|(1-\frac{1}{\epsilon}\rho|e|)<0 ρe(1ϵ1ρe)<0,这样就可以得到:
V ˙ ≤ − k e 2 \dot V\leq-ke^2 V˙ke2
这个时候又可以用上一篇里面的过程来求解微分方程,得到指数收敛的结论。证明过程如下所示:

往回看,根据 V ( e ) = 1 2 e 2 V_{(e)}=\frac{1}{2}e^2 V(e)=21e2,可以得到 2 V ( e ) = e 2 2V_{(e)}=e^2 2V(e)=e2,也就是 V ˙ ( e ) ≤ − 2 k V ( e ) ( 9 ) \dot V_{(e)}\leq-2kV_{(e)} (9) V˙(e)2kV(e)9 V ˙ ( e ) + 2 k V ( e ) ≤ 0 \dot V_{(e)} +2kV_{(e)}\leq0 V˙(e)+2kV(e)0 ,这是一个微分方程不等式。
为了对这个微分方程不等式进行求解,这里引入一个函数 s ( t ) > 0 s(t)>0 s(t)>0,上面的微分不等式就变成了下面的微分方程。 V ˙ ( e ) + 2 k V ( e ) + s ( t ) = 0 ( 10 ) \dot V_{(e)}+2kV_{(e)}+s(t)=0 (10) V˙(e)+2kV(e)+s(t)=010 把s(t)移到等式右边,可以得到 V ˙ ( e ) + 2 k V ( e ) = − s ( t ) ( 11 ) \dot V_{(e)}+2kV_{(e)}=-s(t) (11) V˙(e)+2kV(e)=s(t)11 解这个非齐次微分方程,可以得到它的通解:
V ( t ) = V ( 0 ) e x p ( − 2 k t ) − e x p ( − 2 k t ) ∫ 0 t e x p ( 2 k τ ) s ( τ ) d τ ( 12 ) V(t)=V(0)exp(-2kt)-exp(-2kt) \int_0^t exp(2k\tau)s(\tau)d\tau (12) V(t)=V(0)exp(2kt)exp(2kt)0texp(2kτ)s(τ)dτ12 其中, e x p ( − 2 k t ) = e − 2 k t exp(-2kt)=e^{-2kt} exp(2kt)=e2kt,为了不和误差e搞混,所以指数项这么写。 对式(12)进行分析,
可以看到, e x p ( − 2 k t ) ∫ 0 t e x p ( 2 k τ ) s ( τ ) d τ > 0 exp(-2kt) \int_0^t exp(2k\tau)s(\tau)d\tau>0 exp(2kt)0texp(2kτ)s(τ)dτ>0 所以, V ( t ) ≤ V ( 0 ) e x p ( − 2 k t ) ( 13 ) V(t)\leq V(0)exp(-2kt) (13) V(t)V(0)exp(2kt)13 也就是,
1 2 e 2 ( t ) ≤ 1 2 e ( 0 ) e x p ( − 2 k t ) ( 14 ) \frac{1}{2}e^2(t)\leq \frac{1}{2}e(0)exp(-2kt) (14) 21e2(t)21e(0)exp(2kt)14 两边同时开方,可以得到
1 2 e 2 ( t ) ≤ 1 2 e ( 0 ) e x p ( − 2 k t ) ( 15 ) \sqrt{ \frac{1}{2}e^2(t)}\leq \sqrt{ \frac{1}{2}e(0)exp(-2kt) } (15) 21e2(t) 21e(0)exp(2kt) 15
∣ e ( t ) ∣ ≤ ∣ e ( 0 ) ∣ e x p ( − k t ) ( 16 ) |e(t)|\leq |e(0)|exp(-kt) (16) e(t)e(0)exp(kt)16 通过(16)就可以发现,误差是指数渐进收敛的(exponentially stable)

Case2: ρ ∣ e ∣ ≤ ϵ \rho|e|\leq\epsilon ρeϵ

这个时候 1 ϵ ρ ∣ e ∣ ≤ 1 \frac{1}{\epsilon}\rho|e|\leq1 ϵ1ρe1,移项得到 1 − 1 ϵ ρ ∣ e ∣ ≥ 0 1-\frac{1}{\epsilon}\rho|e|\geq0 1ϵ1ρe0,同时可以发现这个式子还是小于等于1的,
1 ≥ 1 − 1 ϵ ρ ∣ e ∣ ≥ 0 1\geq1-\frac{1}{\epsilon}\rho|e|\geq0 11ϵ1ρe0
等式两边同时乘 ρ ∣ e ∣ \rho|e| ρe,就可以得到
ρ ∣ e ∣ ≥ ρ ∣ e ∣ ( 1 − 1 ϵ ρ ∣ e ∣ ) \rho|e|\geq\rho|e|(1-\frac{1}{\epsilon}\rho|e|) ρeρe(1ϵ1ρe)
又因为 ρ ∣ e ∣ ≤ ϵ \rho|e|\leq\epsilon ρeϵ,所以就有
ϵ ≥ ρ ∣ e ∣ ≥ ρ ∣ e ∣ ( 1 − 1 ϵ ρ ∣ e ∣ ) \epsilon\geq\rho|e|\geq\rho|e|(1-\frac{1}{\epsilon}\rho|e|) ϵρeρe(1ϵ1ρe)
那么
V ˙ ≤ − k e 2 + ϵ \dot V\leq-ke^2+\epsilon V˙ke2+ϵ

接下来又是一套丝滑小连招,还是要求解微分方程,用到的都是之前用过的东西。

因为根据设定 V = 1 2 e 2 V=\frac{1}{2}e^2 V=21e2,两边同时乘 − k -k k
− k e 2 = − 2 k V -ke^2=-2kV ke2=2kV
所以,
V ˙ ≤ − 2 k V + ϵ \dot V\leq-2kV+\epsilon V˙2kV+ϵ
这是一个微分方程不等式,为了求解它,又一次引入一个正函数, s ( t ) > 0 s(t)>0 s(t)>0
这样做的目的就是为了把不等式变成等式,进而解方程。
V ˙ + − 2 k V = ϵ − s ( t ) \dot V+-2kV=\epsilon-s(t) V˙+2kV=ϵs(t)
得到通解:
V ( t ) = V ( 0 ) e x p ( − 2 k t ) − e x p ( − 2 k t ) ∫ 0 t e x p ( 2 k τ ) s ( τ ) d τ + ϵ e x p ( − 2 k t ) ∫ 0 t e x p ( 2 k τ ) d τ V(t)=V(0)exp(-2kt)-exp(-2kt) \int_0^t exp(2k\tau)s(\tau)d\tau+\epsilon exp(-2kt) \int_0^t exp(2k\tau)d\tau V(t)=V(0)exp(2kt)exp(2kt)0texp(2kτ)s(τ)dτ+ϵexp(2kt)0texp(2kτ)dτ
其中, e x p ( − 2 k t ) = e − 2 k t > 0 exp(-2kt)=e^{-2kt}>0 exp(2kt)=e2kt>0 ∫ 0 t e x p ( 2 k τ ) s ( τ ) d τ > 0 \int_0^t exp(2k\tau)s(\tau)d\tau>0 0texp(2kτ)s(τ)dτ>0
∫ 0 t e x p ( 2 k τ ) s ( τ ) d τ = 1 2 k ∫ 0 t e x p ( 2 k τ ) d 2 k τ = 1 2 k ( e x p ( 2 k t ) − 1 ) \int_0^t exp(2k\tau)s(\tau)d\tau=\frac{1}{2k}\int_0^t exp(2k\tau)d2k\tau=\frac{1}{2k}(exp(2kt)-1) 0texp(2kτ)s(τ)dτ=2k10texp(2kτ)d2kτ=2k1(exp(2kt)1)
ϵ e x p ( − 2 k t ) ∫ 0 t e x p ( 2 k τ ) d τ = ϵ e x p ( − 2 k t ) 1 2 k ( e x p ( 2 k t ) − 1 ) \epsilon exp(-2kt) \int_0^t exp(2k\tau)d\tau=\epsilon exp(-2kt)\frac{1}{2k}(exp(2kt)-1) ϵexp(2kt)0texp(2kτ)dτ=ϵexp(2kt)2k1(exp(2kt)1)
进一步化简可以得到
ϵ e x p ( − 2 k t ) ∫ 0 t e x p ( 2 k τ ) d τ = ϵ 2 k ( 1 − e x p ( − 2 k t ) ) \epsilon exp(-2kt) \int_0^t exp(2k\tau)d\tau=\frac{\epsilon}{2k}(1-exp(-2kt)) ϵexp(2kt)0texp(2kτ)dτ=2kϵ(1exp(2kt))
把这些带回到通解中,
V ( t ) ≤ V ( 0 ) e x p ( − 2 k t ) − 0 + ϵ 2 k ( 1 − e x p ( − 2 k t ) ) V(t)\leq V(0)exp(-2kt)-0+\frac{\epsilon}{2k}(1-exp(-2kt)) V(t)V(0)exp(2kt)0+2kϵ(1exp(2kt))
又因为 V ( t ) = 1 2 e 2 ( t ) V(t)=\frac{1}{2}e^2(t) V(t)=21e2(t) V ( 0 ) = 1 2 e 2 ( 0 ) V(0)=\frac{1}{2}e^2(0) V(0)=21e2(0)
所以,
1 2 e 2 ( t ) ≤ 1 2 e 2 ( 0 ) e x p ( − 2 k t ) + ϵ 2 k ( 1 − e x p ( − 2 k t ) ) \frac{1}{2}e^2(t)\leq \frac{1}{2}e^2(0)exp(-2kt)+\frac{\epsilon}{2k}(1-exp(-2kt)) 21e2(t)21e2(0)exp(2kt)+2kϵ(1exp(2kt))
消除掉 1 2 \frac{1}{2} 21,再两边同时开根号,
∣ e ( t ) ∣ ≤ ∣ e ( 0 ) ∣ e x p ( − 2 k t ) + ϵ k − ϵ k e x p ( − 2 k t ) |e(t)|\leq\sqrt{|e(0)|exp(-2kt)+\frac{\epsilon}{k}-\frac{\epsilon}{k}exp(-2kt)} e(t)e(0)exp(2kt)+kϵkϵexp(2kt)
t → ∞ t\rightarrow\infty t ∣ e ( 0 ) ∣ e x p ( − 2 k t ) → 0 |e(0)|exp(-2kt)\rightarrow 0 e(0)exp(2kt)0 − ϵ k e x p ( − 2 k t ) → 0 -\frac{\epsilon}{k}exp(-2kt)\rightarrow 0 kϵexp(2kt)0,也就可以得到最终的结论
∣ e ( t ) ∣ ≤ ϵ k |e(t)|\leq\sqrt{\frac{\epsilon}{k}} e(t)kϵ
分析这个结果可以发现,误差不是一个趋近于0的数值,而是一个始终有界的结果,即全局一致最终有界,对应的英文单词是Globally uniformly ultimately bounded (GUUB)
ϵ \epsilon ϵ 很小时, e → 0 e\rightarrow 0 e0,但是,与此同时 u a u x 2 = 1 ϵ ρ 2 e u_{aux2}=\frac{1}{\epsilon}\rho ^2e uaux2=ϵ1ρ2e,就会变得很大,也就是控制量的输出比较大,也就意味着费劲,耗能多
所以说,误差和u这两个之间存在trade-off(权衡)。换句话说,想要误差变小,就要选取比较小的 ϵ \epsilon ϵ,代价就是控制量变大。所以要选择合适的 ϵ \epsilon ϵ,能够让误差是你可以接受的,同时不要给执行器带来太大负担。

4、 High Frequency 原理及稳定性证明

u a u x 3 = ρ 2 e ρ ∣ e ∣ + ϵ , ϵ > 0 u_{aux3}=\frac{\rho ^2e}{\rho|e|+\epsilon}, \epsilon>0 uaux3=ρe+ϵρ2e,ϵ>0
对于这个式子来说,当 ϵ = 0 \epsilon=0 ϵ=0,式子就变成了 ρ 2 e ρ ∣ e ∣ = ρ e ∣ e ∣ \frac{\rho ^2e}{\rho|e|}=\rho\frac{ e}{|e|} ρeρ2e=ρee,也就退回到了滑模控制。
ϵ ≠ 0 \epsilon\neq 0 ϵ=0时, ∣ ρ 2 e ρ ∣ e ∣ + ϵ ∣ < 1 |\frac{\rho ^2e}{\rho|e|+\epsilon}|<1 ρe+ϵρ2e<1

切换
用图画出来可以看到,原来的滑模控制是在-1到1之间切换,现在是在一个更小的范围内来回切换,所以就是切换没那么剧烈了,平缓一些。

接下来是和前面 u a u x 2 u_{aux2} uaux2类似的证明过程。

  • 稳定性证明 u = x ˙ d + k e + ρ 2 e ρ ∣ e ∣ + ϵ u=\dot x_d+ke+\frac{\rho ^2e}{\rho|e|+\epsilon} u=x˙d+ke+ρe+ϵρ2e

    V = 1 2 e 2 V=\frac{1}{2}e^2 V=21e2
    V ˙ = e e ˙ = e ( x ˙ d − f ( x ) − k e − x ˙ d − ρ 2 e ρ ∣ e ∣ + ϵ ) = − e f ( x ) − k e 2 − ρ 2 e 2 ρ ∣ e ∣ + ϵ \dot V=e\dot e=e(\dot x_d-f(x)-ke-\dot x_d-\frac{\rho ^2e}{\rho|e|+\epsilon})=-ef(x)-ke^2-\frac{\rho ^2e^2}{\rho|e|+\epsilon} V˙=ee˙=e(x˙df(x)kex˙dρe+ϵρ2e)=ef(x)ke2ρe+ϵρ2e2
    还是同样的缩放策略, 因为 f ( x ) f(x) f(x)是有界的,并且 f ( x ) < ρ f(x)<\rho f(x)<ρ,所以如下不等式成立:
    − e f ( x ) ≤ ∣ e ∣ ∣ f ( x ) ≤ ∣ e ∣ ρ -ef(x)\leq|e||f(x)\leq|e|\rho ef(x)e∣∣f(x)eρ
    下面对 V ˙ \dot V V˙进行缩放:
    V ˙ ≤ e ∣ ρ ∣ − k e 2 − ρ 2 e 2 ρ ∣ e ∣ + ϵ = − k e 2 + ρ 2 e 2 + ρ ∣ e ∣ ϵ − ρ 2 e 2 ρ ∣ e ∣ + ϵ = − k e 2 + ϵ ( ρ ∣ e ∣ ρ ∣ e ∣ + ϵ ) \dot V\leq e|\rho|-ke^2-\frac{\rho ^2e^2}{\rho|e|+\epsilon}=-ke^2+\frac{\rho^2e^2+\rho |e|\epsilon-\rho ^2e^2}{\rho|e|+\epsilon}=-ke^2+\epsilon(\frac{\rho |e|}{\rho|e|+\epsilon}) V˙eρke2ρe+ϵρ2e2=ke2+ρe+ϵρ2e2+ρeϵρ2e2=ke2+ϵ(ρe+ϵρe)
    其中, 0 ≤ ρ ∣ e ∣ ρ ∣ e ∣ + ϵ ≤ 1 0\leq\frac{\rho |e|}{\rho|e|+\epsilon}\leq1 0ρe+ϵρe1
    所以,可以得到
    V ˙ ≤ − k e 2 + ϵ \dot V\leq-ke^2+\epsilon V˙ke2+ϵ
    这个式子和前面high-gain控制器得到的一样了,后面是一模一样的求解微分方程,最终得到
    ∣ e ( t ) ∣ ≤ ϵ k |e(t)|\leq\sqrt{\frac{\epsilon}{k}} e(t)kϵ

总结

系统: x ˙ = f ( x ) + u \dot{x}=f(x)+u x˙=f(x)+u ∣ f ( x ) ∣ < ρ ( x ) |f(x)|<\rho(x) f(x)<ρ(x)
设计控制器u,目标是实现 t → ∞ t\rightarrow\infty t时, e = x d − x e=x_d-x e=xdx, e → 0 e\rightarrow0 e0
u = x ˙ d + k e + u a u x u=\dot x_d+ke+u_{aux} u=x˙d+ke+uaux
u a u x = { ρ ∣ e ∣ e sliding mode 1 ϵ ρ 2 e high gain  ρ 2 e ρ ∣ e ∣ + ϵ high frequency  u_{aux} = \begin{cases} \rho \frac{|e|}{e} & \text{sliding mode} \\ \frac{1}{\epsilon}\rho ^2e & \text{high gain } \\ \frac{\rho ^2e}{\rho|e|+\epsilon} & \text{high frequency } \end{cases} uaux= ρeeϵ1ρ2eρe+ϵρ2esliding modehigh gain high frequency 

这一篇证明了这几种鲁棒控制器的稳定性,公式很多,但是自己推导一遍也就觉得没那么难了。下面就可以打开simulink进行验证了。也就是下一篇博客要写的内容啦~

参考视频链接

Dr.Can视频链接: link.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值