什么是SSM?——状态空间模型(Structured Space Model)
1. 基本定义
- 源于现代控制系统理论。SSM是用于描述序列在各时间步的状态表示,并根据输入预测其下一个状态的模型。原始理论处理连续函数。
- 输入序列 x ( t ) x(t) x(t)
- 隐状态表示 h ( t ) h(t) h(t)
- 预测输出序列 y ( t ) y(t) y(t)
2. 公式表示
- h ′ ( t ) = A h ( t ) + B x ( t ) h'(t) = Ah(t) + Bx(t) h′(t)=Ah(t)+Bx(t)
- y ( t ) = C h ( t ) + D x ( t ) y(t) = Ch(t) + Dx(t) y(t)=Ch(t)+Dx(t)
公式详解文章链接
3. 连续函数离散化——零阶保持
- h t = A ‾ h t − 1 + B ‾ x t h_t = \overline{A}h_{t-1} + \overline{B}x_t ht=Aht−1+Bxt, h 0 = B ‾ x 0 h_0 = \overline{B}x_0 h0=Bx0
- y t = C ‾ h t y_t = \overline{C}h_t yt=Cht
公式详解文章链接
4. 卷积与递归双重属性
公式推导:
y 2 = C h 2 y_2 = Ch_2 y2=Ch2
h 2 = A ‾ h 1 + B ‾ x 2 h_2 = \overline{A}h_1 + \overline{B}x_2 h2=Ah1+Bx2
h 1 = A ‾ h 0 + B ‾ x 1 h_1 = \overline{A}h_0 + \overline{B}x_1 h1=Ah0+Bx1
h 0 = B ‾ x 0 h_0 = \overline{B}x_0 h0=Bx0
结合起来:
y 2 = C ( A ‾ h 1