序列数据建模与机器学习案例研究
1. 序列数据建模
1.1 隐马尔可夫模型(HMM)参数估计
在已知隐马尔可夫模型(HMM)能生成某个序列的情况下,估计其参数是一个监督学习问题。可以通过使用 Count() 函数计算不同概率来从训练示例中轻松获得这些参数。
- 转移概率矩阵 $A$ 的元素 $A_{i,j}$ 可通过计算状态 $s_j$ 后跟随状态 $s_i$ 的次数来估计:
- $A_{i,j} = P(s_j|s_i) = \frac{Count(s_j,s_i)}{Count(s_i)}$
- 数组 $b(k)$ 的元素可通过计算观察状态 $v_k$ 与隐藏状态 $s_j$ 同时出现的次数来估计:
- $b_j(k) = P(v_k|s_j) = \frac{Count(v_k,s_j)}{Count(s_j)}$
- 初始概率计算如下:
- $\pi_i = P(q_1 = s_i) = \frac{Count(q_1 = s_i)}{Count(q_1)}$
如果仅提供观察序列 $O$,需要学习使该序列概率最大化的模型,这是一个无监督学习问题,可使用期望最大化(EM)算法的一种变体——鲍姆 - 韦尔奇(Baum - Welch)算法来解决。
1.2 条件随机场(CRF)
条件随机场(CRF)在序列建模领域与隐马尔可夫模型(HMM)有类似的关系,类似于朴素贝叶斯和逻辑回归的关系。HMM 在有效建模输入或观察状态之间的依赖关系以及它们之间的重叠关系方面存在不足。线性链 CRF 可以被视为线性 HMM 的无向图模型等价形式。CRF 主要用于监督学习问
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



