抛一枚硬币,掌握三种参数估计方法

假设有一枚硬币,每次投掷后正面朝上的概率未知。我们将这枚硬币独立投掷  次,其中正面朝上出现了  次。

问题:如何估计这个硬币正面朝上的概率 

韩梅梅:很简单, 嘛?

李雷:不对,不管  和  是多少,这个硬币它正面朝上的 概率必须是50%啊。

韩梅梅:李雷你太顽固了,这枚硬币也没有说一定是均匀的呀,假如抛了1000次,没有1次正面朝上,你还敢说正面朝上的概率是50%吗?

李雷:如果只抛了1次,反面朝上,那按照韩梅梅你的说法,你敢说这个硬币正面朝上的概率是0%?

李雷和韩梅梅说的好像都有些道理,李雷更加重视过往积累的一般经验,而韩梅梅呢更加重视具体数据。

但要把这个事情完全讲清楚,并不是那么容易的。我们将祭出大名鼎鼎的贝叶斯公式。并介绍与之相关的三种重要的参数估计方法:极大似然估计,最大后验估计,以及贝叶斯估计。

一、从贝叶斯公式说起

假设我们要估计的参数是 ,观察到的数据是 ,这时贝叶斯公式为:

其中:

  • 后验概率,在观测到数据  之后,参数  的概率分布。它体现了我们在看到数据之后对参数的相信程度。

  • 似然函数,在参数为  时,观测到数据  的概率。它衡量了参数  下数据  出现的可能性。

  • 先验概率,在观测数据之前,我们对参数  的主观认识或相信程度。

  • 边缘似然,所有参数情况下,观测到数据  的概率。它起归一化作用,保证后验概率和为1。

为什么  叫做边缘似然呢?因为它是似然函数对  的边缘化。"边缘化"是概率论中消除联合分布中多余变量的标准操作。

贝叶斯公式告诉我们:后验概率 = 先验概率 × 似然函数 / 归一化常数

二、极大似然估计

极大似然估计 简称MLE (Maximum Likelihood Estimation)。

极大似然估计的思路是:在所有可能的参数中,找到最有可能生成观测数据的那个参数

对于硬币问题,单次投掷正面概率为 ,反面概率为 ,总共  次投掷,正面  次,反面  次。观测数据的似然函数为:

MLE 的目标是最大化似然函数 ,即:

通常取对数方便计算:

对  求导并令其为0:

解得:

即,极大似然估计就是正面出现的频率。

韩梅梅的估计方法实际上就是极大似然估计,完全不考虑贝叶斯公式中的先验项。

三、最大后验估计

最大后验估计 简称MAP(Maximum A Posteriori Estimation)。

最大后验估计考虑了参数的先验知识,即我们在投掷硬币前对  的主观认识。MAP 的目标是最大化后验概率:

假设  的先验是  分布,则:

则后验为:

对数化后求极值:

同样求导等于0:

解得:

当先验参数  时,MAP 就退化为 MLE。

李雷的认知,基本上就是类似 这种状态,先验强的一匹,观察到的的一点点数据很难影响他的先验认知。

四、贝叶斯估计

贝叶斯估计的目标不是给出一个点估计,而是利用后验分布的性质进行估计,常用的是后验均值(期望):

对于 Beta 先验和似然,上述后验也是 Beta 分布:

Beta 分布的均值为:

贝叶斯估计不仅给出一个点估计,还给出  的后验分布,可以反映参数的不确定性。

五、对比总结

  • 极大似然估计(MLE):仅考虑数据本身,不引入先验知识,等价于经验风险最小化(ERM),容易受到数据量小或极端数据的影响(比如一枚新硬币只投了一次就正面朝上,MLE会认为)。

  • 最大后验估计(MAP):引入先验,等价于带正则化项的极大似然(如 L2 正则化对应正态分布先验, L1正则化对应双指数分布先验),相当于结构风险最小化(SRM)。

  • 贝叶斯估计:不仅仅给出一个点估计,而是完整的参数分布,能直接反映不确定性。

在机器学习中,极大似然估计最大后验估计最常见。极大似然对应无正则化的传统机器学习模型,最大后验估计对应带有正则化项的模型。正则化项的本质就是先验知识的体现。

  • 经验风险最小化(ERM):只关注训练数据的拟合。

  • 结构风险最小化(SRM):在拟合数据的基础上,增加模型的复杂度控制(正则化),有助于提升泛化能力。

贝叶斯方法虽然理论完善,但在实际大规模机器学习中的应用受限于计算复杂度,但在需要建模不确定性、数据稀缺等场景下非常有价值。

小结

  • 极大似然估计:只看数据,点估计,容易过拟合。

  • 最大后验估计:数据+先验,点估计,等价于正则化。

  • 贝叶斯估计:数据+先验,分布估计,能反映参数不确定性。

理解这些估计方法及其联系,对于深入理解机器学习模型的本质、正则化的意义,以及模型选择和泛化性能提升都至关重要。

【四轴飞行器】非线性三自由度四轴飞行器模拟器研究(Matlab代码实现)内容概要:本文围绕非线性三自由度四轴飞行器模拟器的研究展开,重点介绍基于Matlab代码实现的四轴飞行器动力学建模与仿真方法。研究构建了考虑非线性特性的飞行器数学模型,涵盖姿态动力学与运动学方程,实现了三自由度(滚转、俯仰、偏航)的精确模拟。文中详细阐述了系统建模过程、控制算法设计思路及仿真结果分析,帮助读者深入理解四轴飞行器的飞行动力学特性与控制机制;同时,该模拟器可用于算法验证、控制器设计与教学实验。; 适合人群:具备一定自动控制理论基础和Matlab编程能力的高校学生、科研人员及无人机相关领域的工程技术人员,尤其适合从事飞行器建模、控制算法开发的研究生和初级研究人员。; 使用场景及目标:①用于四轴飞行器非线性动力学特性的学习与仿真验证;②作为控制器(如PID、LQR、MPC等)设计与测试的仿真平台;③支持无人机控制系统教学与科研项目开发,提升对姿态控制与系统仿真的理解。; 阅读建议:建议读者结合Matlab代码逐模块分析,重点关注动力学方程的推导与实现方式,动手运行并调试仿真程序,以加深对飞行器姿态控制过程的理解。同时可扩展为六自由度模型或加入外部干扰以增强仿真真实性。
基于分布式模型预测控制DMPC的多智能体点对点过渡轨迹生成研究(Matlab代码实现)内容概要:本文围绕“基于分布式模型预测控制(DMPC)的多智能体点对点过渡轨迹生成研究”展开,重点介绍如何利用DMPC方法实现多智能体系统在复杂环境下的协同轨迹规划与控制。文中结合Matlab代码实现,详细阐述了DMPC的基本原理、数学建模过程以及在多智能体系统中的具体应用,涵盖点对点转移、避障处理、状态约束与通信拓扑等关键技术环节。研究强调算法的分布式特性,提升系统的可扩展性与鲁棒性,适用于多无人机、无人车编队等场景。同时,文档列举了大量相关科研方向与代码资源,展示了DMPC在路径规划、协同控制、电力系统、信号处理等多领域的广泛应用。; 适合人群:具备一定自动化、控制理论或机器人学基础的研究生、科研人员及从事智能系统开发的工程技术人员;熟悉Matlab/Simulink仿真环境,对多智能体协同控制、优化算法有一定兴趣或研究需求的人员。; 使用场景及目标:①用于多智能体系统的轨迹生成与协同控制研究,如无人机集群、无人驾驶车队等;②作为DMPC算法学习与仿真实践的参考资料,帮助理解分布式优化与模型预测控制的结合机制;③支撑科研论文复现、毕业设计或项目开发中的算法验证与性能对比。; 阅读建议:建议读者结合提供的Matlab代码进行实践操作,重点关注DMPC的优化建模、约束处理与信息交互机制;按文档结构逐步学习,同时参考文中提及的路径规划、协同控制等相关案例,加深对分布式控制系统的整体理解。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值