统计估计器:自然语言处理中的概率估计方法
1. 期望似然估计(ELE)
在自然语言处理里,期望似然估计(ELE)是一种重要的概率估计方法。以单词“was”后面所接单词的概率估计为例,下面的表格展示了最大似然估计(MLE)和期望似然估计(ELE)的结果:
| Rank | Word | MLE | ELE |
| ---- | ---- | ---- | ---- |
| 1 | not | 0.065 | 0.036 |
| 2 | a | 0.052 | 0.030 |
| 3 | the | 0.033 | 0.019 |
| 4 | to | 0.031 | 0.017 |
| inferior | 0 | 0.00003 |
在训练语料库中,“not”出现了608次,而语料库总共包含14589种不同的单词类型。新的估计值为((608 / (14589 \times 0.5)) = 0.036),相较于MLE,ELE对出现过的单词的概率估计进行了折扣处理,同时为未出现的单词赋予了非零的出现概率。不过,ELE对一个子句的概率估计为(6.89 \times 10^{-10}),低于基于一元语法计数的MLE估计,这反映出在构建ELE模型时,对已见n - 元语法的MLE概率估计进行了大幅折扣。尽管概率估计值极低,但ELE仍可用于对不同选项进行排序。
2. 留出估计(Held out estimation)
2.1 留出估计器
为了判断给未出现事件分配46.5%的概率空间是否过多,可采用留出估计的方法。具体而言,对于每个n - 元语法,设(c_r)为其在训练数据中的频
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



