**困惑度(Perplexity)**是自然语言处理和机器学习中常用的评价指标,尤其在评估语言模型时广泛使用。它衡量的是一个概率模型对一个样本(如一句话)的预测能力。
一、困惑度的定义
对于一个语言模型 $ P $ 和一个测试语料 $ W = w_1, w_2, \dots, w_N $,其困惑度定义为:
Perplexity=P(w1,w2,…,wN)−1N=exp(−1N∑i=1NlogP(wi)) \text{Perplexity} = P(w_1, w_2, \dots, w_N)^{-\frac{1}{N}} = \exp\left( -\frac{1}{N} \sum_{i=1}^N \log P(w_i) \right) Perplexity=P(w1,w2,…,wN)−N1