负二项分布

详情查看链接:https://www.jianshu.com/p/ad24bb90b972

【如有侵权,请告知】

二项分布描述的是n重伯努利实验,在n重贝努利试验中,事件A恰好发生x(0≤x≤n)次的概率

它的概率分布图如下:

负二项分布描述的也是伯努利实验,不过它的目标事件变成了:对于Bernoulli过程,我们设定,当某个结果出现固定次数的时候,整个过程的数量,比如我们生产某个零件,假设每个零件的合格与否都是相互独立的,且分布相同,那么当我们生产出了五个不合格零件时,一共生产了多少合格的零件,这个数量就是一个负二项分布

泊松分布是一种离散概率分布,用于表示在一个固定间隔时间内某事件发生次数的概率。该分布由一个参数$\lambda$决定,代表单位时间内的平均发生率。 泊松分布的概率质量函数可以写作: $$ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} $$ 其中$k$是非负整数(0, 1, 2...),代表某个特定时间段内发生的次数。 负二项分布也是一种离散概率分布,通常用来建模一系列独立伯努利试验中,在达到固定的失败次数$r$之前成功的次数。当$r=1$时,这被称为几何分布。负二项分布有两个参数:成功概率$p$和目标失败次数$r$。 负二项分布的概率质量函数如下所示: $$ P(X=k) = {k+r-1 \choose r-1} p^{r}(1-p)^{k} $$ 这里$k$同样是一个非负整数,代表在第$r$次失败前的成功次数。 两者的主要区别在于方差与均值的关系上。对于泊松分布来说,均值等于方差($E[X] = Var(X)$),而对于负二项分布而言,方差总是大于均值($Var(X)> E[X]$)。这种过分散现象使得负二项分布在处理某些类型的计数数据方面比泊松分布更为合适,例如基因表达数据分析中的RNA序列读取数量变化较大情况下的应用。 应用场景对比: - **泊松分布**常应用于模拟稀有事件的发生频率,比如每小时进入商店的顾客人数、放射性物质衰变粒子的数量或者电话呼叫中心接到的来电数目等场景下。 - **负二项分布**则更多地出现在需要考虑额外变异的情况下,即观测到的数据展示出超过理论预测范围的变化程度之时。这类情形包括但不限于生物信息学领域里不同样本间的基因表达水平测量误差较大的案例研究之中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值