泊松分布推导

泊松与二项分布关系
本文探讨了泊松分布与二项分布之间的联系,指出泊松分布是当二项分布中试验次数n极大而每次试验成功概率p极小时的极限形式。通过实例解释了这两种分布的应用场景。

https://blog.youkuaiyun.com/u013346007/article/details/53044417


结论:泊松分布是二项分布n很大而p很小时的一种极限形式

二项分布是说,已知某件事情发生的概率是p,那么做n次试验,事情发生的次数就服从于二项分布。

泊松分布是指某段连续的时间内某件事情发生的次数,而且“某件事情发生所用的时间”是可以忽略的。

二项分布的数学期望E(X),即时间发生次数的期望,即是泊松分布的lambda


先说结论:泊松分布是二项分布n很大而p很小时的一种极限形式

二项分布是说,已知某件事情发生的概率是p,那么做n次试验,事情发生的次数就服从于二项分布。

泊松分布是指某段连续的时间内某件事情发生的次数,而且“某件事情”发生所用的时间是可以忽略的。例如,在五分钟内,电子元件遭受脉冲的次数,就服从于泊松分布。

假如你把“连续的时间”分割成无数小份,那么每个小份之间都是相互独立的。在每个很小的时间区间内,电子元件都有可能“遭受到脉冲”或者“没有遭受到脉冲”,这就可以被认为是一个p很小的二项分布。而因为“连续的时间”被分割成无穷多份,因此n(试验次数)很大。所以,泊松分布可以认为是二项分布的一种极限形式。

因为二项分布其实就是一个最最简单的“发生”与“不发生”的分布,它可以描述非常多的随机的自然界现象,因此其极限形式泊松分布自然也是非常有用的。


可以用等公交车作为例子:
某个公交站台一个小时内出现了的公交车的数量 就用泊松分布来表示
某个公交站台任意两辆公交车出现的间隔时间 就用指数分布来表示

知乎:https://www.zhihu.com/question/26441147


### 泊松分布检验的方法 泊松分布在许多实际场景中被广泛应用于建模稀有事件的发生频率。为了验证一组数据是否服从泊松分布,可以采用多种统计学方法来进行假设检验。 #### 假设设定 通常情况下,在进行泊松分布的检验时会设立两个假设: - **原假设 (H₀)**:样本数据来自泊松分布。 - **备择假设 (H₁)**:样本数据不来自泊松分布。 以下是几种常见的泊松分布检验方法及其示例: --- #### 1. 卡方拟合优度检验 (Chi-Square Goodness-of-Fit Test) 卡方检验是一种常用的非参数检验方法,用于比较观测频数与理论频数之间的差异。对于泊松分布的检验,可以通过计算期望值并与实际观察到的数据对比来完成。 ##### 实现步骤说明 通过以下 Python 示例展示如何利用 `scipy.stats` 进行卡方检验: ```python import numpy as np from scipy.stats import chisquare, poisson # 数据集(假设有这些计数值) observed_data = [0, 1, 2, 3, 4, 5] # 对应的实际观测频数 frequencies = [10, 20, 30, 25, 10, 5] # 计算总样本量 N 和估计 λ 参数 N = sum(frequencies) lambda_estimated = sum([i * f / N for i, f in zip(observed_data, frequencies)]) # 使用估计的 lambda 构造理论频数 expected_frequencies = [poisson.pmf(i, mu=lambda_estimated) * N for i in observed_data] # 执行卡方检验 chi_statistic, chi_p_value = chisquare(f_obs=frequencies, f_exp=expected_frequencies) print("卡方统计量:", chi_statistic) print("p-value:", chi_p_value) ``` 此代码片段展示了如何基于观测数据和理论分布构建卡方检验,并得出相应的 p 值[^1]。 --- #### 2. Kolmogorov-Smirnov 检验 (KS 检验) Kolmogorov-Smirnov 检验适用于连续型变量以及某些离散型变量的情况。尽管 KS 检验主要用于连续分布,但在适当调整下也可以用来评估离散分布如泊松分布的适配情况。 下面给出一个简单的例子: ```python from scipy.stats import kstest # 同样使用之前估算出来的 lambda 值 data_sample = np.random.poisson(lam=lambda_estimated, size=N) # 调整为累积分布函数形式以便于 ks 测试 def cdf(x): return poisson.cdf(k=x, mu=lambda_estimated) ks_statistic, ks_p_value = kstest(data_sample, cdf=cdf) print("KS 统计量:", ks_statistic) print("p-value:", ks_p_value) ``` 这里需要注意的是,由于 KS 检验本质上针对连续分布设计,因此可能需要额外处理以适应离散分布特性[^2]。 --- #### 3. V 检验法或其他特定领域技术 除了上述通用方法外,还有专门针对于泊松过程特性的检测手段,比如 V 检验等高级技巧。这类方法往往依赖更复杂的数学推导或者模拟实验支持其有效性判断标准。 --- ### 结果解释 无论采取哪种方式,最终都需要关注所得出的 p 值大小。一般而言,如果 p 值小于显著性水平 α (例如 0.05),则拒绝零假设 H₀;反之,则接受该组数据符合所指定的泊松分布模式[^3]。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值