对自己研究的帮助
求解因变量,解决非凸问题帮助很大
大概框架
摘要
我们如何将机器学习应用于表示为一系列观察结果的数据?马尔可夫模型是一种关于状态随时间推移的推理形式,隐马尔可夫模型是我们希望从一系列观察中恢复一系列状态的模型。
马尔可夫模型
假设一组状态S = {s1,s2,...s|S|},我们可以观察一个时间序列 z ∈ ST。例如,我们可能有来自天气系统S = {太阳,云,雨}的状态,其中|S| = 3,并观察几天的天气{z1= ssun,z2= scloud,z3= scloud,z4= srain,z5= scloud},T = 5。我们的天气例子的观测状态代表一个随机过程随时间的输出
马尔可夫假设:
- 有限视界假设:在t时刻处于一种状态的概率只取决于t-1的状态,即时间t-1的状态代表了对过去的足够总结。P(zt|zt−1, zt−2, ..., z1) = P(zt|zt−1)
- 平稳过程假设:给定当前状态下的下一状态的条件分布不随时间变化。P(zt|zt−1) = P(z2|z1); t ∈ 2...T
状态转移参数化:我们定义转移矩阵来参数化这些转移,Aij值表示在任何时间t从状态i转换到状态j的概率。
结合假设和状态转移参数化,我们可以得到特定的状态序列z的概率是多少?我们如何估计模型A的参数,使观测序列z的可能性最大化?
- 利用概率的链式法则来计算一系列特定状态z的概率
在第二行中,我们将初始值z0引入到我们的联合概率中,这是z