【统计学】深入理解最大似然估计(MLE, maximum likelihood estimation)

本文介绍最大似然估计的基本原理及应用,通过摸球游戏案例解释如何利用样本数据估计伯努利分布参数,并探讨了理论基础及其在高斯分布中的应用。

目录

1. 前言

2. 案例导入

3. 理论阐述

4. 伯努利分布

5. 高斯(正态)分布


1. 前言

最大似然估计就是利用已知的样本结果,在使用某个模型的基础上,反推最有可能导致这样的结果的模型参数。

2. 案例导入

这里我们用一个经典的摸球游戏来阐述最大似然估计在伯努利分布模型上的应用。

假设一个袋子里面装有红球和白球,比例未知,现在我们要抽取10次(每次抽完都放回,保证每次抽取的独立性),假设抽取到了7次白球和3次红球(最大似然估计是“一种模型已经确定,参数未知”基于样本的的参数估计方法)。显而易见,此时样本的白球比例为70%,但如何通过理论的方法推知该袋中最大可能性的白球红球比例呢?一些简单的情况,很容易做出一个推断,如上面的摸球模型,就可以直接根据样本情况估计最有可能袋子里就是7个白球3个红球。但是,在一些复杂的情况下,是很难通过直观的方式获得答案的,这时候理论分析就变得格外重要,这也是最值似然估计要解决的问题。我们可以定义从袋子中连续两次摸球的概率为:

                                    

因为θ是未知的,所以我们定义似然L为:

                              

两边取ln,取ln是为了将右边的乘号变成加号,以方便求导。

两边同时取对数,左边通常称为对数似然。

有时,也有上式为平均对数似然。

最大似然估计的过程,就是找到一个合适的theta,使得平均对数似然最大。因此,可以得到以下公式:

这里讨论的是2次采样的情况,当然也可以将其拓展到多次采样的情况:

我们定义M为模型,表示抽到白球的概率为θ,而抽到红球的概率为1-θ,因此10次抽取到白球7次的概率可以表示为:

### 最大似然估计的概念 最大似然估计Maximum Likelihood Estimation, MLE)是一种用于参数估计的重要方法,在统计学机器学习领域广泛应用。该方法的核心在于寻找能够使观测数据出现概率最大的模型参数集[^1]。 ### 数学原理 从数学角度讲,给定一组独立同分布的样本 \(X_1,X_2,\ldots,X_n\) 和未知参数 \(\theta\) 下的概率密度函数 \(f(X_i|\theta)\),则联合概率可表示为: \[L(\theta|X)=\prod_{i=1}^{n}{f(X_i|\theta)}\] 为了简化计算通常取对数形式得到对数函数: \[l(\theta|X)=\sum_{i=1}^{n}\log{f(X_i|\theta)}\] 最终目标是求解使得上述表达式达到极值点对应的参数向量 \(\hat{\theta}_{ML}\)。 ```python import numpy as np from scipy.optimize import minimize def log_likelihood(params, data): mu, sigma = params n = len(data) ll = -n/2 * np.log(2*np.pi*sigma**2) - (np.sum((data-mu)**2))/(2*sigma**2) return -ll # 负号是因为minimize找最小值而我们要最大化likelihood initial_guess = [0, 1] result = minimize(log_likelihood, initial_guess, args=(data,)) mle_estimate = result.x ``` 这段Python代码展示了如何使用SciPy库来实现一维高斯分布下的最大似然估计过程。 ### 实际应用场景 在实际应用中,MLE广泛应用于各种场景之中,比如但不限于以下方面: - **回归分析**:在线性回归或者逻辑回归等问题里用来确定权重系数; - **分类问题**:构建朴素贝叶斯分类器时评估类别条件概率; - **时间序列预测**:ARIMA等模型训练过程中调整自回归项和平滑移动平均项之间的平衡; 值得注意的是,虽MLE提供了一种有效的参数估计手段,但在某些情况下可能会遇到过拟合的风险。此时可以通过引入正则化项或将MLE扩展至MAP等方式加以改进[^2]。
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值