28、概率DFA与上下文无关文法的识别算法研究-优快云博客

本文链接：https://blog.youkuaiyun.com/agile9scrum/article/details/153802825

概率DFA与上下文无关文法的识别算法研究

1. 概率确定实时自动机（PDRTA）识别的似然比检验

1.1 似然比检验原理

在识别PDRTA时，部分字符串会到达顶部树，部分到达底部树。设 $S = {10 × a, 10 × aa, 20 × ab, 10 × b}$ 和 $S′ = {20 × aa, 20 × bb}$ 分别为字符串到达顶部和底部树根状态后的后缀，其中 $n× τ$ 表示（定时）字符串 $τ$ 出现 $n$ 次。

首先，设置顶部树的参数以最大化 $S$ 的似然：$p_{a,q0} = \frac{4}{5}$，$p_{b,q0} = \frac{1}{5}$，$p_{a,q1} = \frac{1}{3}$，$p_{b,q1} = \frac{2}{3}$；对底部树和 $S′$ 做同样操作：$p′ {a,q0} = \frac{1}{2}$，$p′ {b,q0} = \frac{1}{2}$，$p′ {a,q1} = 1$，$p {b,q2} = 1$。

然后计算概率：
- 顶部树中 $S$ 的概率 $p_1 = (\frac{4}{5})^{40} × (\frac{1}{5})^{10} × (\frac{1}{3})^{10} × (\frac{2}{3})^{20} ≈ 6.932 × 10^{-20}$。
- 底部树中 $S′$ 的概率 $p_2 = (\frac{1}{2})^{20} × (\frac{1}{2})^{20} ≈ 9.095 × 10^{-13}$。

接着设置右侧（合并）树的参数以最大化 $S ∪ S′$ 的似然：$p_{a,