指数族分布基础

本文介绍了指数族分布的概念及其数学表达式,并通过伯努利分布、高斯分布和泊松分布等例子进行了具体说明。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

指数族分布

如果一类分布可以写成如下形式,则它可以叫做 *指数族分布*  (exponential family distributions) 。

p ( y ; η ) = b ( y ) e x p ( η T T ( y ) − a ( η ) ) p(y;\eta) = b(y) exp(\eta^TT(y) - a(\eta)) p(y;η)=b(y)exp(ηTT(y)a(η))

其中 η \eta η 是自然参数(也叫canonical parameter), T ( y ) T(y) T(y) 是充分统计量(通常 T ( y ) = y T(y)=y T(y)=y), a ( η ) a(\eta) a(η) 为对数分布函数, e − a ( η ) e^{-a(\eta)} ea(η) 起着归一化常数的作用,使得概率分布 p ( y ; η ) p(y;\eta) p(y;η) y y y 和 1 之间求和或者求积分。

如果分布中的 T , a , b T,a,b T,a,b 固定,当 η \eta η 改变时,将在这个家族中获得不同的分布。

伯努利分布(也叫两点分布,0-1分布)和高斯分布都属于指数族分布。下面介绍一下原因。

1. 伯努利分布

p ( y ; ϕ ) = ϕ y ( 1 − ϕ ) 1 − y = exp ⁡ ( ln ⁡ ( ϕ y ( 1 − ϕ ) 1 − y ) ) = exp ⁡ ( y ln ⁡ ( ϕ ) + ( 1 − y ) ln ⁡ ( 1 − ϕ ) ) = exp ⁡ ( y ln ⁡ ( ϕ 1 − ϕ ) + ln ⁡ ( 1 − ϕ ) ) \begin{aligned} p(y ; \phi) &=\phi^{y}(1-\phi)^{1-y} \\ &=\exp \left(\ln \left(\phi^{y}(1-\phi)^{1-y}\right)\right) \\ &=\exp (y \ln (\phi)+(1-y) \ln (1-\phi)) \\ &=\exp \left(y \ln \left(\frac{\phi}{1-\phi}\right)+\ln (1-\phi)\right) \end{aligned} p(y;ϕ)=ϕy(1ϕ)1y=exp(ln(ϕy(1ϕ)1y))=exp(yln(ϕ)+(1y)ln(1ϕ))=exp(yln(1ϕϕ)+ln(1ϕ))

对应公式(1),可得:
b ( y ) = 1 , T ( y ) = y ; η = l n ϕ 1 − ϕ , a ( η ) = − l n ( 1 − ϕ ) = l n ( 1 + e η ) b(y) = 1,T(y) = y;\eta = ln \frac{\phi}{1-\phi} ,a(\eta) = -ln(1-\phi) = ln(1+e^{\eta}) b(y)=1,T(y)=y;η=ln1ϕϕ,a(η)=ln(1ϕ)=ln(1+eη)

2. 高斯分布

因为 p ( y ; u ) p(y;u) p(y;u) 中没有 σ 2 \sigma^2 σ2所以我们令 σ 2 = 1 \sigma^2 = 1 σ2=1
p ( y ; μ ) = 1 2 π exp ⁡ ( − 1 2 ( y − μ ) 2 ) = 1 2 π exp ⁡ ( − 1 2 y 2 ) exp ⁡ ( μ y − 1 2 μ 2 ) \begin{aligned} p(y ; \mu) &=\frac{1}{\sqrt{2 \pi}} \exp \left(-\frac{1}{2}(y-\mu)^{2}\right) \\ &=\frac{1}{\sqrt{2 \pi}} \exp \left(-\frac{1}{2} y^{2}\right) \exp \left(\mu y-\frac{1}{2} \mu^{2}\right) \end{aligned} p(y;μ)=2π 1exp(21(yμ)2)=2π 1exp(21y2)exp(μy21μ2)
对应公式(1),可得:
b ( y ) = 1 2 π e x p ( − 1 2 y 2 ) , T ( y ) = y ; η = μ , a ( η ) = μ 2 / 2 = η 2 / 2 b(y) = \frac{1}{\sqrt{2\pi}}exp(-\frac{1}{2}y^2),T(y) = y;\eta =\mu ,a(\eta) = \mu^2/2 = \eta^2/2 b(y)=2π 1exp(21y2),T(y)=y;η=μ,a(η)=μ2/2=η2/2

3.泊松分布

p ( y ; λ ) = λ y e − λ y ! = exp ⁡ ( ln ⁡ λ y e − λ y ! ) = exp ⁡ ( y ln ⁡ ( λ ) − λ − ln ⁡ ( y ! ) ) = 1 y ! exp ⁡ ( y ln ⁡ ( λ ) − λ ) \begin{aligned} p(y ; \lambda) &=\frac{\lambda^{y} e^{-\lambda}}{y !} \\ &=\exp \left(\ln \frac{\lambda^{y} e^{-\lambda}}{y !}\right) \\ &=\exp (y \ln (\lambda)-\lambda-\ln (y !)) \\ &=\frac{1}{y !} \exp (y \ln (\lambda)-\lambda) \end{aligned} p(y;λ)=y!λyeλ=exp(lny!λyeλ)=exp(yln(λ)λln(y!))=y!1exp(yln(λ)λ)

对应公式(1),可得:
b ( y ) = 1 y ! , T ( y ) = y ; η = l n ( λ ) , a ( η ) = λ = e η b(y) = \frac{1}{y!},T(y) = y;\eta =ln(\lambda) ,a(\eta) = \lambda = e^{\eta} b(y)=y!1,T(y)=y;η=ln(λ),a(η)=λ=eη

泊松分布族是指数型分布族吗?
斯坦福机器学习课程Lecture 1(cs229-notes1)

### 关于指数分布族与广义线性模型的关系 在统计学领域,广义线性模型(GLM)提供了一种灵活的方法来建模响应变量 \(y\) 与其预测因子之间的关系。不同于经典的线性回归假定误差项遵循正态分布,在广义线性框架下,\(y\) 可以来自更广泛的概率分布——即所谓的指数分布族[^1]。 #### 定义与特性 指数分布族是一类能够被表达成特定参数形式的概率密度或质量函数集合。这类分布具有统一的数学结构,允许通过调整自然参数 \(\eta\) 来适应不同的实际应用场景。具体来说,当给定输入特征向量 \(x\) 后,目标变量 \(y| x; \theta\) 被认为是从某个具体的指数分布中抽取出来的样本[^4]。 对于某些常见的离散和连续数据类型,如计数资料、比例数据以及生存时间等,都存在相应的成员归属于此大家庭之中: - **伯努利分布**用于描述只有两种可能结果的现象; - **泊松分布**适用于处理事件发生次数的数据集; - **高斯/正态分布**则是衡量连续数值型测量值的标准工具之一[^2]; 这些特殊的案例展示了如何利用不同类型的指数分布构建适合各自特点的广义线性模型实例[^3]。 ### 应用场景举例 考虑到上述提到的各种情况,下面给出几个基于指数分布族建立起来的具体应用例子: 1. 对于二分类问题,可以选择逻辑斯特回归作为解决方案,此时所依据的就是伯努利分布。 ```r glm(formula = outcome ~ ., family = binomial(), data = dataset) ``` 2. 当面对的是非负整数计数时,则可采用泊松回归来进行分析,它依赖于泊松分布的特点。 ```r glm(formula = count_variable ~ predictors, family = poisson(link="log"), data=dataset) ``` 3. 若研究对象涉及连续性的度量指标,且满足近似常态的要求的话,那么传统的最小二乘法下的多元线性回归实际上就是一种特殊情况下的广义线性模型,这里的基础便是高斯分布。 ```r lm(formula = continuous_response ~ covariates, data = dataframe) ``` 综上所述,通过对各种不同类型的实际问题选用恰当的指数分布成员将其融入到广义线性模型当中去,可以有效地提高模型拟合效果及其解释能力。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值