一、公式定义
在时间ttt观察到xtx_{t}xt,那么得到TTT个不独立的随机变量(x1,...,xT)−p(X)(x_{1},...,x_{T})-p(X)(x1,...,xT)−p(X)
由条件概率公式:
p(a,b)=p(a)p(b∣a)=p(b)p(a∣b)p(a,b)=p(a)p(b|a)=p(b)p(a|b)p(a,b)=p(a)p(b∣a)=p(b)p(a∣b)
可得序列模型的统计学公式:
p(X)=p(x1)⋅p(x2∣x1)⋅...p(xT∣x1,...,xT−1)p(X)=p(x_{1})·p(x_{2}|x_{1})·...p(x_{T}|x_{1},...,x_{T-1})p(X)=p(x1)⋅p(x2∣x1)⋅...p(xT∣x1,...,xT−1)
二、序列建模
序列模型的任务可看作求解p(xt∣x1,...,xt−1)p(x_{t}|x_{1},...,x_{t-1})p(xt∣x1,...,xt−1),其可以通过对条件概率建模的方法求解,即:
p(xt∣x1,...,xt−1)=p(xt∣f(x1,...,xt−1))p(x_{t}|x_{1},...,x_{t-1})=p(x_{t}|f(x_{1},...,x_{t-1}))p(xt∣x1,...,xt−1)=p(xt∣f(x1,...,xt−1))
其中 p(xt∣x1,...,xt−1)p(x_{t}|x_{1},...,x_{t-1})p(xt∣x1,...,xt−1)的意思是:在给定前t−1t-1t−1个数据的前提下,求第ttt个数据的概率。p(xt∣f(x1,...,xt−1))p(x_{t}|f(x_{1},...,x_{t-1}))p(xt∣f(x1,...,xt−1))的意思是:对已有的t−1t-1t−1个数据建立一个模型,用这个模型去预测第ttt个数据,也成为自回归模型。
三、建模方法
3.1 马尔科夫方法
假设当前数据只与τττ个过去的数据有关,则:
p(xt∣x1,...,xt−1)=p(xt∣f(xt−τ,...,xt−1))=p(xt∣f(xt−τ,...,xt−1))p(x_{t}|x_{1},...,x_{t-1})=p(x_{t}|f(x_{t-τ},...,x_{t-1}))=p(x_{t}|f(x_{t-τ},...,x_{t-1}))p(xt∣x1,...,xt−1)=p(xt∣f(xt−τ,...,xt−1))=p(xt∣f(xt−τ,...,xt−1))
3.2 潜变量方法
引入潜变量hth_{t}ht来表示过去信息ht=f(x1,...,xt−1)h_{t}=f(x_{1},...,x_{t-1})ht=f(x1,...,xt−1),则xt=p(xt∣ht)x_{t}=p(x_{t}|h_{t})xt=p(xt∣ht)

四、总结
在时序模型中,当前数据与之前观察到的数据相关;
在自回归模型中,使用自身过去的数据预测未来的数据。
3370

被折叠的 条评论
为什么被折叠?



