基于高斯过程和GP - UCB算法的未知动力学学习与吸引域估计
在研究非线性系统的稳定性和吸引域(Region of Attraction, ROA)估计时,高斯过程(Gaussian Process, GP)和基于GP - UCB(Gaussian Process Upper Confidence Bound)的采样算法为我们提供了一种有效的方法。下面将详细介绍相关理论和算法,并通过单机无穷大母线(Single - Machine Infinite - Bus, SMIB)系统和IEEE 39总线系统的数值模拟进行验证。
1. 高斯过程用于学习未知动力学
在学习未知动力学时,我们考虑观测数据 $y(i)$,它是在第 $i$ 个采样步骤中输入 $x(i)$ 对应的观测函数值,测量噪声 $\epsilon$ 是零均值、独立且有界的,其界为 $\sigma$。
1.1 高斯过程与再生核希尔伯特空间(RKHS)范数
将未知的李雅普诺夫函数 $V(x)$ 看作随机变量,它可以用高斯过程近似。协方差或核函数 $k(x, x’)$ 编码了 $V(x)$ 的平滑性。对于已知高斯过程分布的样本 $\hat{V}_N = [\hat{V}(x(1)), \cdots, \hat{V}(x(N))]^T$,其中 $\hat{V}(x(i)) = V(x(i))+\epsilon$,$\epsilon\sim N(0, \sigma^2)$,后验分布的均值 $\mu_N(x)$、协方差 $k_N(x, x’)$ 和方差 $\sigma_N^2(x)$ 的解析公式如下:
- $\mu_N(x) = k_N(x)^T (K_N+\sigma^2I)^{-1}\hat{V}
超级会员免费看
订阅专栏 解锁全文
7967

被折叠的 条评论
为什么被折叠?



