问题:
thew这个单词打错了,我们猜测更可能是the和thaw中的哪个?
普通人猜测过程:本来thaw很少见,再加上,thew不太可能被写成thaw,所以thew更可能是the
这里隐含了贝叶斯估计过程:
贝叶斯公式:P(h | D) ∝ P(h) * P(D | h)
建模:
我们假设h为猜测单词(the、thaw),D为观测数据(thew)
分析:
1. 本来the很常见见,说明the词频大,也就是说先验概率P(h)大。
2. the比较容易误写成thew,说明似然函数P(D|h)的值大。
因此P(the | thew) = P(the) * P(thew | the)值就大。
结论:
所以误写的thew很可能真正要写的是the。
参考: