负二项分布

本文详细介绍了负二项分布的定义、概率质量函数、期望、方差、累积分布函数,并探讨了其在时间序列预测模型中的使用,特别是在DeepAR等模型中的参数输出策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文链接个人站 | 简书 | 优快云
版权声明:除特别声明外,本博客文章均采用 BY-NC-SA 许可协议。转载请注明出处。

之前在介绍 DeepAR 等时间序列预测模型时,为了简单起见,我们使用了大家比较熟悉的正态分布作为示例。在实际应用中,需要根据数据本身的特点选择合适的分布。泊松分布、二项分布、以及负二项分布都可以用来刻画计数类数据。其中,泊松分布的 μ = σ 2 \mu=\sigma^2 μ=σ2,二项分布的 μ ≥ σ 2 \mu\geq\sigma^2 μσ2,负二项分布的 μ ≤ σ 2 \mu\leq\sigma^2 μσ2。在我日常接触的业务场景中, μ ≤ σ 2 \mu\leq\sigma^2 μσ2 较为常见,为此免不了要跟负二项分布打交道。

虽然没什么必要,但是本着「有困难要上,没困难创造困难也要上」的精神,我们还是来推导一下负二项分布的相关公式。

1. 定义

一个成功概率为 p p p 的伯努利试验,不断重复,直至失败 r r r 次。此时成功的次数为一个随机变量,用 X X X 表示。称 X X X 服从负二项分布,记作 X ∼ N B ( r , p ) X\sim NB(r, p) XNB(r,p)

需要注意的是,负二项分布的定义并不唯一。例如 tensorflow_probability 使用的定义与本文一致,而 scipy 则将 X X X 定义为伯努利试验成功 r r r 次时的失败次数。使用前一定要先看清楚,别问我怎么知道的。此外,Wikipedia 词条不同段落使用的定义竟然也不完全一致,或许是由不同的人编辑的。

2. 概率质量函数

X = k X=k X=k 时总共进行了 k + r k+r k+r 次试验,最后一次为失败,故前 k + r − 1 k+r-1 k+r1 次试验总共成功了 k k k 次,失败了 r − 1 r-1 r1 次。因此
f ( k ; r , p ) ≡ P r ( X = k ) = ( k + r − 1 k ) p k ( 1 − p ) r f(k; r, p)\equiv Pr(X=k)=\tbinom{k+r-1}{k}p^k(1-p)^r f(k;r,p)Pr(X=k)=(kk+r1)pk(1p)r

3. 期望

根据定义
E X = ∑ k = 0 ∞ k f ( k ; r , p ) = ∑ k = 1 ∞ k f ( k ; r , p ) = ∑ k = 1 ∞ k ( k + r − 1 ) ! k ! ( r − 1 ) ! p k ( 1 − p ) r = r p 1 − p ∑ k = 1 ∞ [ ( k − 1 ) + ( r + 1 ) − 1 ] ! ( k − 1 ) ! [ ( r + 1 ) − 1 ] ! p k − 1 ( 1 − p ) r + 1 = r p 1 − p ∑ k = 1 ∞ f ( k − 1 ; r + 1 , p ) \begin{aligned} \mathbb{E}X &=\sum\limits_{k=0}^{\infty}kf(k;r,p)\\ &=\sum\limits_{k=1}^{\infty}kf(k;r,p)\\ &=\sum\limits_{k=1}^{\infty}k\frac{(k+r-1)!}{k!(r-1)!}p^k(1-p)^r\\ &=\frac{rp}{1-p} \sum\limits_{k=1}^{\infty}\frac{[(k-1)+(r+1)-1]!}{(k-1)![(r+1)-1]!}p^{k-1}(1-p)^{r+1}\\ &=\frac{rp}{1-p} \sum\limits_{k=1}^{\infty}f(k-1;r+1,p) \end{aligned} EX=k=0kf(k;r,p)=k=1kf(k;r,p)=k=1kk!(r1)!(k+r1)!pk(1p)r=1prpk=1(k1)![(r+1)1]![(k1)+(r+1)1]!pk1(1p)r+1=1prpk=1f(k1;r+1,p)
k ′ = k − 1 k'=k-1 k=k1 r ′ = r + 1 r'=r+1 r=r+1,显然
∑ k = 1 ∞ f ( k − 1 ; r + 1 , p ) = ∑ k ′ = 0 ∞ f ( k ′ ; r ′ , p ) = 1 \sum\limits_{k=1}^{\infty}f(k-1;r+1,p)=\sum\limits_{k'=0}^{\infty}f(k';r',p)=1 k=1f(k1;r+1,p)=k=0f(k;r,p)=1

E X = r p 1 − p \mathbb{E}X = \frac{rp}{1-p} EX=1prp

4. 方差

首先计算
E X 2 = ∑ k = 0 ∞ k 2 f ( k ; r , p ) = r p 1 − p ∑ k = 1 ∞ k f ( k − 1 ; r + 1 , p ) \begin{aligned} \mathbb{E}X^2 &=\sum\limits_{k=0}^{\infty}k^2f(k;r,p)\\ &=\frac{rp}{1-p}\sum\limits_{k=1}^{\infty}kf(k-1;r+1,p) \end{aligned} EX2=k=0

泊松分布是一种离散概率分布,用于表示在一个固定间隔时间内某事件发生次数的概率。该分布由一个参数$\lambda$决定,代表单位时间内的平均发生率。 泊松分布的概率质量函数可以写作: $$ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} $$ 其中$k$是非负整数(0, 1, 2...),代表某个特定时间段内发生的次数。 负二项分布也是一种离散概率分布,通常用来建模一系列独立伯努利试验中,在达到固定的失败次数$r$之前成功的次数。当$r=1$时,这被称为几何分布。负二项分布有两个参数:成功概率$p$和目标失败次数$r$。 负二项分布的概率质量函数如下所示: $$ P(X=k) = {k+r-1 \choose r-1} p^{r}(1-p)^{k} $$ 这里$k$同样是一个非负整数,代表在第$r$次失败前的成功次数。 两者的主要区别在于方差与均值的关系上。对于泊松分布来说,均值等于方差($E[X] = Var(X)$),而对于负二项分布而言,方差总是大于均值($Var(X)> E[X]$)。这种过分散现象使得负二项分布在处理某些类型的计数数据方面比泊松分布更为合适,例如基因表达数据分析中的RNA序列读取数量变化较大情况下的应用。 应用场景对比: - **泊松分布**常应用于模拟稀有事件的发生频率,比如每小时进入商店的顾客人数、放射性物质衰变粒子的数量或者电话呼叫中心接到的来电数目等场景下。 - **负二项分布**则更多地出现在需要考虑额外变异的情况下,即观测到的数据展示出超过理论预测范围的变化程度之时。这类情形包括但不限于生物信息学领域里不同样本间的基因表达水平测量误差较大的案例研究之中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值