概率DFA与上下文无关文法的识别算法研究
1. 概率确定实时自动机(PDRTA)识别的似然比检验
1.1 似然比检验原理
在识别PDRTA时,部分字符串会到达顶部树,部分到达底部树。设 $S = {10 × a, 10 × aa, 20 × ab, 10 × b}$ 和 $S′ = {20 × aa, 20 × bb}$ 分别为字符串到达顶部和底部树根状态后的后缀,其中 $n× τ$ 表示(定时)字符串 $τ$ 出现 $n$ 次。
首先,设置顶部树的参数以最大化 $S$ 的似然:$p_{a,q0} = \frac{4}{5}$,$p_{b,q0} = \frac{1}{5}$,$p_{a,q1} = \frac{1}{3}$,$p_{b,q1} = \frac{2}{3}$;对底部树和 $S′$ 做同样操作:$p′ {a,q0} = \frac{1}{2}$,$p′ {b,q0} = \frac{1}{2}$,$p′ {a,q1} = 1$,$p {b,q2} = 1$。
然后计算概率:
- 顶部树中 $S$ 的概率 $p_1 = (\frac{4}{5})^{40} × (\frac{1}{5})^{10} × (\frac{1}{3})^{10} × (\frac{2}{3})^{20} ≈ 6.932 × 10^{-20}$。
- 底部树中 $S′$ 的概率 $p_2 = (\frac{1}{2})^{20} × (\frac{1}{2})^{20} ≈ 9.095 × 10^{-13}$。
接着设置右侧(合并)树的参数以最大化 $S ∪ S′$ 的似然:$p_{a,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



