极大似然估计和贝叶斯估计

极大似然估计

  • 设总体服从分布 f(x;θ1,...,θk)f(x; \theta_1, ..., \theta_k)f(x;θ1,...,θk)X1,...,X2X_1, ..., X_2X1,...,X2 为从这个总体中抽出的样本,则样本 (X1,...,X2)(X_1, ..., X_2)(X1,...,X2) 的分布为

L(x1,...,x2;θ1,...,θk)=∏i=1nf(xi;θ1,...,θk)L(x_1, ..., x_2; \theta_1, ..., \theta_k) = \prod _{ i=1 }^{ n }{ f\left( { x }_{ i }; \theta_1, ..., \theta_k\right) } L(x1,...,x2;θ1,...,θk)=i=1nf(xi;θ1,...,θk)

  • 当已观察到 X1,...,X2X_1, ..., X_2X1,...,X2 时,若有 L(x1,...,x2;θ1′,...,θk′)>L(x1,...,x2;θ1′′,...,θk′′)L(x_1, ..., x_2; \theta_1^{\prime}, ..., \theta_k^{\prime}) > L(x_1, ..., x_2; \theta_1^{\prime\prime}, ..., \theta_k^{\prime\prime})L(x1,...,x2;θ1,...,θk)>L(x1,...,x2;θ1,...,θk),则被估计的参数 (θ1,...,θk)(\theta_1, ..., \theta_k)(θ1,...,θk)(θ1′,...,θk′)(\theta_1^{\prime}, ..., \theta_k^{\prime})(θ1,...,θk) 的可能性比它是 (θ1′′,...,θk′′)(\theta_1^{\prime\prime}, ..., \theta_k^{\prime\prime})(θ1,...,θk) 的可能性大

  • X1,...,X2X_1, ..., X_2X1,...,X2 固定时,称 LLL 为参数 (θ1,...,θk)(\theta_1, ..., \theta_k)(θ1,...,θk)似然函数;估计参数时,应该用使似然函数取最大值的点 (θ1∗,...,θk∗)(\theta_1^*, ..., \theta_k^*)(θ1,...,θk) 作为参数 (θ1,...,θk)(\theta_1, ..., \theta_k)(θ1,...,θk) 的估计值,即

L(x1,...,x2;θ1∗,...,θk∗)=maxθ1,...,θkL(x1,...,x2;θ1,...,θk)L(x_1, ..., x_2; \theta_1^*, ..., \theta_k^*) = \underset {\theta_1, ..., \theta_k}{\rm max }L(x_1, ..., x_2; \theta_1, ..., \theta_k)L(x1,...,x2;θ1,...,θk)=θ1,...,θkmaxL(x1,...,x2;θ1,...,θk)

  • 为使 LLL 最大,只需使 lnL{\rm ln}LlnL 最大,也就是令似然方程组
    ∂lnL∂θi=∂∑i=1nlnf(xi;θ1,...,θk)∂θi=0,i=1,...,k\frac { \partial {\rm ln}L }{ \partial { \theta }_{ i } } =\frac { \partial \sum _{ i=1 }^{ n }{\rm ln } f\left( { x }_{ i }; \theta_1, ..., \theta_k\right) }{ \partial { \theta }_{ i } } = 0, \quad i = 1, ..., kθilnL=θii=1nlnf(xi;θ1,...,θk)=0,i=1,...,k

极大似然估计要求分布有参数的形式;在各种估计方法中,极大似然估计相对来说比较优良

贝叶斯估计

  • 贝叶斯估计要求在采样前已经对参数 θ\thetaθ 有了一定的知识,即先验知识;先验知识用 θ\thetaθ 的某种概率分布表示,称为 θ\thetaθ先验分布,记为 h(θ)h(\theta)h(θ)h(θ)h(\theta)h(θ) 总结了我们对参数 θ\thetaθ 的先验知识

  • 设总体服从分布 f(X,θ)f(\bm{X}, \theta)f(X,θ)X1,...,X2X_1, ..., X_2X1,...,X2 为从这个总体中抽出的样本,则样本 (X1,...,X2)(X_1, ..., X_2)(X1,...,X2) 的分布为 ∏i=1nf(Xn,θ)\prod _{ i=1 }^{ n }{ f(\bm{X}_n, \theta) }i=1nf(Xn,θ);这可视为在给定 θ\thetaθ 值时样本 (X1,...,X2)(X_1, ..., X_2)(X1,...,X2) 的条件密度,从而 (θ,X1,...,X2)(\theta, X_1, ..., X_2)(θ,X1,...,X2) 的联合密度为 h(θ)∏i=1nf(Xn,θ)h(\theta)\prod _{ i=1 }^{ n }{ f(\bm{X}_n, \theta) }h(θ)i=1nf(Xn,θ);进一步地,样本 (X1,...,X2)(X_1, ..., X_2)(X1,...,X2) 的边缘密度为
    p(X1,...,X2)=∫h(θ)∏i=1nf(Xn,θ)dθp(X_1, ..., X_2) = \int { h(\theta)\prod _{ i=1 }^{ n }{ f(\bm{X}_n, \theta) } }\rm{d}\thetap(X1,...,X2)=h(θ)i=1nf(Xn,θ)dθ

  • 根据上式,得到给定 (X1,...,X2)(X_1, ..., X_2)(X1,...,X2) 的条件下 θ\thetaθ 的条件密度为
    h(θ∣X1,...,X2)=h(θ)∏i=1nf(Xn,θ)p(X1,...,X2)h(\theta|X_1, ..., X_2)=h(\theta)\frac { \prod _{ i=1 }^{ n }{ f(\bm{X}_n, \theta) } }{ p(X_1, ..., X_2) } h(θX1,...,X2)=h(θ)p(X1,...,X2)i=1nf(Xn,θ)

  • 上式称为参数 θ\thetaθ后验分布,代表了我们得到样本 X1,...,X2X_1, ..., X_2X1,...,X2 后对参数 θ\thetaθ后验知识;后验知识综合了 θ\thetaθ 的先验知识(h(θ)h(\theta)h(θ))和样本带来的信息

  • 得到后验分布后,对参数 θ\thetaθ 的统计推断只能基于这个后验分布,通常取其均值作为对参数 θ\thetaθ 的估计

  • 先验分布的选择:

    • [0,1][0, 1][0,1] 上的均匀分布,即 h(θ)=R(0,1)h(\theta) = R(0, 1)h(θ)=R(0,1)
    • 估计正态分布 N(μ,σ2)\bm{N}(\mu, \sigma^2)N(μ,σ2) 中的 μ\muμ,取 h(μ)=1h(\mu) = 1h(μ)=1;估计 σ\sigmaσ,取 h(σ)=1σh(\sigma) = \frac{1}{\sigma}h(σ)=σ1
    • 估计指数分布中的 λ\lambdaλ,取 h(λ)=1λh(\lambda) = \frac{1}{\lambda}h(λ)=λ1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值