统计学——离散概率分布和连续概率分布

1.离散概率分布

1.1 伯努利分布

伯努利实验:同样的条件下进行的相互独立的实验,特点是实验的可能结果只有两种。成功/失败。如果随机变量X是一次伯努利实验,则这个随机变量就符合伯努利分布。一次抛硬币就是典型的伯努利分布。

1.2 二项分布

二项分布:发生次数是固定的,感兴趣的是成功的次数。

二项分布的判断依据如下:

  • 做某件事的次数(也叫试验次数)是固定的,用n表示。
  • 每一次事件都有两个可能的结果(成功,或者失败)
  • 每一次成功的概率都是相等的,成功的概率用p表示
  • 你感兴趣的是成功x次的概率是多少。那么就可以用二项分布的公式快速计算出来了。

二项分布计算公式:
P(x)=Cnxpx(1−p)n−xP(x) = C_{n}^{x}p^x(1-p)^{n-x}P(x)=Cnxpx(1p)nx
二项分布的期望和方差如下:

期望E(x)=npE(x) = npE(x)=np
方差D(x)=np(1−p)D(x) = np(1-p)D(x)=np(1p)

我们需要注意,当n为1时,就是伯努利分布;而当n很大的时候,二项分布的形状与正态分布类似,所以计算n很大的概率时,可以正态分布计算概率。而当p<0.25,n>20,np<5时,二项分布可以用泊松分布来计算概率。
在这里插入图片描述

1.3 几何分布

几何分布:需要知道尝试多次能取得第一次成功的概率,则需要几何分布。

几何分布判断依据如下:

  • 每一次事件都有两个可能的结果(成功,或者失败)
  • 每一次“成功”的概率都是相等的,成功的概率用p表示
  • 进行x次尝试这个事情,取得第1次成功的概率是多大

几何分布和二项分布很像,但关注点不同,几何分布关注第一次成功的概率,而二项分布关注的是成功的次数。
几何分布的概率计算公式:
P(x)=(1−p)x−1pP(x) = (1-p)^{x-1}pP(x)=(1p)x1p

p为成功概率,即为了在第x次尝试取得第1次成功,首先你要失败(x-1)次。

几何分布的期望和方差:

期望E(x)=1pE(x) = \frac{1}{p}E(x)=p1
方差D(x)=1−pp2D(x) = \frac{1-p}{p^2}D(x)=p21p

当p一定时,x=1的概率最大,随着x的增加概率越来越小。而p=100%时,我们第一次就成功了,而p接近0时,基本上都不会成功。
在这里插入图片描述

1.4 泊松分布

泊松分布:一定时间范围内某个事件发生的概率分布。泊松分布需要满足以下三个条件:

  • 事件是独立事件
  • 在任意相同的时间范围内,事件发生的概率相同
  • 你想知道某个时间范围内,发生某件事情x次的概率是多大

如果你想知道某个时间范围内,发生某件事情x次的概率是多大。比如一天内中奖的次数,一个月内某机器损坏的次数,一段道路发生交通事故的次数等。
泊松分布计算公式:
P(x)=λxe−λx!P(x) = \frac{λ^xe^{-λ}}{x!}P(x)=x!λxeλ

  • x代表你想要计算的事件次数,例如你想要计算一天内中奖7个人的概率,x就是7;
  • λ代表中奖这个事件一天内发生的平均次数,注意跟x区别开来;

泊松分布的期望和方差:

期望E(x)=λE(x)=λE(x)=λ
方差D(x)=λD(x)=λD(x)=λ

λ的大小会影响泊松分布的形状。当λ较小时,泊松分布向右倾斜;当λ增大时,泊松分布逐渐对称;而λ增大到一定程度时,泊松分布呈正态分布。如下图
在这里插入图片描述

2.连续概率分布

2.1 均匀分布

均匀分布:是关于定义在区间a,b上连续变量的简单概率分布,其概率密度函数如下图所示。
在这里插入图片描述
均匀分布的概率密度函数:
f(x)=1a−bf(x) = \frac{1}{a-b}f(x)=ab1
数学期望和方差:

数学期望E(x)=a+b2E(x) = \frac{a+b}{2}E(x)=2a+b
方差D(x)=(b−a)212D(x) = \frac{(b-a)^2}{12}D(x)=12(ba)2

2.2 正态分布

正态分布:连续型随机变量中最重要的分布。世界上绝大部分的分布都属于正态分布,人的身高体重、考试成绩、降雨量等都近似服从。正态分布如同一条钟形曲线。中间高,两边低,左右对称。大部分数据集中在某处,小部分往两端倾斜。如下图所示:
在这里插入图片描述
概率密度函数:
f(x)=1σ2πe−(x−μ)22σ2f(x) = \frac{1}{σ\sqrt{2π}}e^{-\frac{(x-μ)^2}{2σ^2}}f(x)=σ2π1e2σ2(xμ)2
数学期望和方差:

数学期望E(x)=μE(x) = μE(x)=μ
方差D(x)=σ2D(x)=σ^2D(x)=σ2

均值μ表示正态分布的左右偏移,标准差σ决定曲线的宽度和平坦,标准差σ越大曲线越平坦。
在这里插入图片描述
正态分布性质
如果独立随机变量X和Y符合正态分布,那么X+Y也符合正态分布。如果正态分布X~N(μ, σ²)中,Y是一个线性变换的形式aX+b,因为X符合正态分布,所以aX+b也符合正态分布。
在这里插入图片描述

2.3 其他分布

  • Z分布:就是标准的正态分布,普通的正态分布经过Z得分能够得到Z分布;

  • t分布:又叫学生分布,是小样本分布,当t分布随着自由度v的增大越来越趋近于正态分布。
    在这里插入图片描述

  • F分布:两个独立变量组成的概率密度分布。
    在这里插入图片描述

  • 卡方分布:卡方分布通常用于假设检验,特别是拟合优度的卡方检验。
    在这里插入图片描述

在Python中,可以使用概率论中的随机变量分布来进行统计计算。常见的离散型分布包括二项分布泊松分布,连续性分布包括正态分布、均匀分布指数分布等。这些分布可以用来计算概率、期望方差等统计量。 对于正态分布,可以使用scipy.stats库中的norm模块进行计算。例如,可以使用norm.cdf函数计算小于某个值的概率,使用norm.ppf函数计算给定累积概率时的反函数值。代码示例如下: ``` from scipy.stats import norm # 计算小于40的概率 p1 = norm.cdf(40, loc=50, scale=10) # 计算30到40之间的概率 p2 = norm.cdf(40, loc=50, scale=10) - norm.cdf(30, loc=50, scale=10) # 计算小于2.5的概率 p3 = norm.cdf(2.5, 0, 1) # 计算-1.5到2之间的概率 p4 = norm.cdf(2) - norm.cdf(-1.5) # 计算累计概率为0.025时的反函数值 q1 = norm.ppf(0.025, loc=0, scale=1) # 计算累计概率为0.975时的反函数值 q2 = norm.ppf(0.975, 0, 1) print(p1, p2, p3, p4, q1, q2) ``` 对于计算随机变量的概率分布的均值方差,可以使用numpy库进行计算。代码示例如下: ``` import numpy as np # 假设有一个数据框df,其中包含了不合格品数概率 mymean = sum(df['不合格品数'] * df['概率']) # 计算均值 myvar = sum((df['不合格品数'] - mymean) ** 2 * df['概率']) # 计算方差 mystd = np.sqrt(myvar) # 计算标准差 print(mymean, myvar, mystd) ``` 以上是关于Python统计学中随机变量的概率分布的一些基本操作计算方法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Python统计学03——随机变量的概率分布](https://blog.youkuaiyun.com/weixin_46277779/article/details/126673517)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIGC人工智残

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值