最大似然估计简单的理解就是给定已知样本,推导出最有可能(最大概率)导致出现这样结果的参数值
先举个例子来说:
抛硬币80次,49次正面,31次反面,我们需要求出抛硬币为正面的概率p。那出现这个情况的概率为 p 49 ( 1 − p ) 31 p^{49}(1-p)^{31} p49(1−p)31,求出 p p p的值使得该值为最大值。这时只需要求上述式子求导并令一阶导数为零就可以求出 p p p的值了。解得最大似然值 p ^ = 49 / 80 \hat{p}=49/80 p^=49/80
公式
考虑一组含有 m 个样本的数据集 X = x ( 1 ) , . . . , x ( m ) X = {x(1), . . . , x(m)} X=x(1),...,x(m),由 独立分布(重要的前提) 真实的数据分布 p d a t a ( x ) p_{data}(x) pdata(x) 生成。
对 θ θ θ 的最大似然估计被定义为:
θ m l = a r g m a x θ   p m o d e l ( X ; θ ) = a r g m a x θ   ∏ i = 0 m p m o d e l ( x ( i ) ; θ ) \theta_{ml} = \mathop{argmax}_{\theta}\,p_{model}(X;\theta)= \mathop{argmax}_{\theta}\,\prod_{i=0}^m p_{model}(x^{(i)};\theta) θml=argmaxθpmodel(X;θ)=a