统计学习方法 课后题1

本文介绍了统计学习方法的三大核心要素:模型、策略与算法。深入探讨了概率模型中的伯努利模型、二项分布等内容,并详细解释了极大似然估计与贝叶斯估计的方法及其应用。此外,还对比了经验风险最小化与结构风险最小化的概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第一章
这里写图片描述
统计学习方法三要素:模型、策略、算法。
模型

  • 概率模型
  • 伯努利模型 : 定义在取值为0,1的随机变量上的概率分布(条件概率分布)

  • 0-1分布
    p(x)=θx(1θ)1xp(x)=θx(1−θ)1−x ,随机变量xx只取0,1两个值

  • 二项分布
    pn(k)=Cnkθk(1θ)nk ,表示x=1x=1发生kk次的概率, θ 表示每一次实验x=1x=1的概率

  • 经验风险:
    Remp=1Ni=1N(L(xi,f(xi)))Remp=1N∑i=1N(L(xi,f(xi)))
  • 结构风险:
    Rsrm=1Ni=1N(L(xi,f(xi)))+λJ(f)Rsrm=1N∑i=1N(L(xi,f(xi)))+λJ(f)

策略

  • 极大似然:经验风险最小化。
    模型为条件概率分布,损失函数为对数损失函数时,经验风险最小化等价于极大似然估计。
  • 贝叶斯估计:结构风险最小化。
    模型为条件概率分布,损失函数为对数损失函数,模型复杂度由模型先验概率表示时,结构风险最小化等价于最大后验概率估计。

算法

  • 极大似然估计:最大化似然函数,求取能使似然函数最大的值
  • 贝叶斯估计:最大后验概率估计,求取能使其后验分布最大的值

假设随机变量AiAi(独立同分布)表示第ii次试验:

p(Ai=1)=θ,p(Ai=0)=1θ

  • 极大似然估计
    似然函数:L(θ)=ni=1p(Ai)=θk(1θ)nkL(θ)=∏i=1np(Ai)=θk(1−θ)n−k

    argmaxθlog(L(θ))=argmaxθlog(θk(1θ)nk)=argmaxθ(klogθ+(nk)log(1θ))(53)(54)(53)arg⁡maxθ⁡log(L(θ))=arg⁡maxθ⁡log(θk(1−θ)n−k)(54)=arg⁡maxθ⁡(klog⁡θ+(n−k)log⁡(1−θ))

    θθ求偏导,令等式为0,可得,
    kθnk1θ=0kθ−n−k1−θ=0

    解得θ=knθ=kn
  • 贝叶斯估计
    最大后验概率估计 p(θ|A1,A2...An)p(θ|A1,A2...An) , θθ为随机变量,p(θ)p(θ)为模型先验概率服从β分布β(θ;a,b)=θa1(1θ)b1Cβ(θ;a,b)=θa−1(1−θ)b−1C, CC为常数,β分布是伯努利分布的共轭先验分布

    (55)p(θ|A1,A2...An)=p(A1,A2...An|θ)p(θ)p(A1,A2...An)(56)p(A1,A2...An|θ)p(θ)(57)=i=1np(Ai|θ)p(θ)(58)=θk(1θ)nkθa1(1θ)b1(59)=θa1+k(1θb1+nk

argmaxθp(θ|A1,A2...An)argmaxθθa1+k(1θb1+nkarg⁡maxθ⁡p(θ|A1,A2...An)⇔arg⁡maxθ⁡θa−1+k(1−θ)b−1+n−k

对等式右边取对数,求偏导,令等式为0,可得
θ=a1+kn+(a1)+(b1)θ=a−1+kn+(a−1)+(b−1)

其中,a,ba,b的取值
这里写图片描述
ββ分布概率密度函数

这里写图片描述

  • 条件概率分布:P(Y|X)P(Y|X)
  • 损失函数:L(Y,P(Y|X))=logP(Y|X)L(Y,P(Y|X))=−log⁡P(Y|X)
  • 似然函数:L(θ)=ni=1p(yi|xi,θ)L(θ)=∏i=1np(yi|xi,θ)
  • 经验风险最小化:
    minθRemp=minθ1ni=1nL(yi,p(yi|xi,θ))=minθ1ni=1n(log(p(yi|xi,θ))=minθ1ni=1nlogp(yi|xi,θ)maxθ1ni=1nlogp(yi|xi,θ)=maxθ1nlog(i=1np(yi|xi,θ))maxθL(θ)(60)(61)(62)(63)(64)(65)(60)minθRemp=minθ1n∑i=1nL(yi,p(yi|xi,θ))(61)=minθ1n∑i=1n(−log(p(yi|xi,θ))(62)=minθ−1n∑i=1nlogp(yi|xi,θ)(63)⇔maxθ1n∑i=1nlogp(yi|xi,θ)(64)=maxθ1nlog(∏i=1np(yi|xi,θ))(65)⇔maxθL(θ)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值