统计学——离散概率分布和连续概率分布

1.离散概率分布

1.1 伯努利分布

伯努利实验:同样的条件下进行的相互独立的实验,特点是实验的可能结果只有两种。成功/失败。如果随机变量X是一次伯努利实验,则这个随机变量就符合伯努利分布。一次抛硬币就是典型的伯努利分布。

1.2 二项分布

二项分布:发生次数是固定的,感兴趣的是成功的次数。

二项分布的判断依据如下:

  • 做某件事的次数(也叫试验次数)是固定的,用n表示。
  • 每一次事件都有两个可能的结果(成功,或者失败)
  • 每一次成功的概率都是相等的,成功的概率用p表示
  • 你感兴趣的是成功x次的概率是多少。那么就可以用二项分布的公式快速计算出来了。

二项分布计算公式:
P(x)=Cnxpx(1−p)n−xP(x) = C_{n}^{x}p^x(1-p)^{n-x}P(x)=Cnxpx(1p)nx
二项分布的期望和方差如下:

期望E(x)=npE(x) = npE(x)=np
方差D(x)=np(1−p)D(x) = np(1-p)D(x)=np(1p)

我们需要注意,当n为1时,就是伯努利分布;而当n很大的时候,二项分布的形状与正态分布类似,所以计算n很大的概率时,可以正态分布计算概率。而当p<0.25,n>20,np<5时,二项分布可以用泊松分布来计算概率。
在这里插入图片描述

1.3 几何分布

几何分布:需要知道尝试多次能取得第一次成功的概率,则需要几何分布。

几何分布判断依据如下:

  • 每一次事件都有两个可能的结果(成功,或者失败)
  • 每一次“成功”的概率都是相等的,成功的概率用p表示
  • 进行x次尝试这个事情,取得第1次成功的概率是多大

几何分布和二项分布很像,但关注点不同,几何分布关注第一次成功的概率,而二项分布关注的是成功的次数。
几何分布的概率计算公式:
P(x)=(1−p)x−1pP(x) = (1-p)^{x-1}pP(x)=(1p)x1p

p为成功概率,即为了在第x次尝试取得第1次成功,首先你要失败(x-1)次。

几何分布的期望和方差:

期望E(x)=1pE(x) = \frac{1}{p}E(x)=p1
方差D(x)=1−pp2D(x) = \frac{1-p}{p^2}D(x)=p21p

当p一定时,x=1的概率最大,随着x的增加概率越来越小。而p=100%时,我们第一次就成功了,而p接近0时,基本上都不会成功。
在这里插入图片描述

1.4 泊松分布

泊松分布:一定时间范围内某个事件发生的概率分布。泊松分布需要满足以下三个条件:

  • 事件是独立事件
  • 在任意相同的时间范围内,事件发生的概率相同
  • 你想知道某个时间范围内,发生某件事情x次的概率是多大

如果你想知道某个时间范围内,发生某件事情x次的概率是多大。比如一天内中奖的次数,一个月内某机器损坏的次数,一段道路发生交通事故的次数等。
泊松分布计算公式:
P(x)=λxe−λx!P(x) = \frac{λ^xe^{-λ}}{x!}P(x)=x!λxeλ

  • x代表你想要计算的事件次数,例如你想要计算一天内中奖7个人的概率,x就是7;
  • λ代表中奖这个事件一天内发生的平均次数,注意跟x区别开来;

泊松分布的期望和方差:

期望E(x)=λE(x)=λE(x)=λ
方差D(x)=λD(x)=λD(x)=λ

λ的大小会影响泊松分布的形状。当λ较小时,泊松分布向右倾斜;当λ增大时,泊松分布逐渐对称;而λ增大到一定程度时,泊松分布呈正态分布。如下图
在这里插入图片描述

2.连续概率分布

2.1 均匀分布

均匀分布:是关于定义在区间a,b上连续变量的简单概率分布,其概率密度函数如下图所示。
在这里插入图片描述
均匀分布的概率密度函数:
f(x)=1a−bf(x) = \frac{1}{a-b}f(x)=ab1
数学期望和方差:

数学期望E(x)=a+b2E(x) = \frac{a+b}{2}E(x)=2a+b
方差D(x)=(b−a)212D(x) = \frac{(b-a)^2}{12}D(x)=12(ba)2

2.2 正态分布

正态分布:连续型随机变量中最重要的分布。世界上绝大部分的分布都属于正态分布,人的身高体重、考试成绩、降雨量等都近似服从。正态分布如同一条钟形曲线。中间高,两边低,左右对称。大部分数据集中在某处,小部分往两端倾斜。如下图所示:
在这里插入图片描述
概率密度函数:
f(x)=1σ2πe−(x−μ)22σ2f(x) = \frac{1}{σ\sqrt{2π}}e^{-\frac{(x-μ)^2}{2σ^2}}f(x)=σ2π1e2σ2(xμ)2
数学期望和方差:

数学期望E(x)=μE(x) = μE(x)=μ
方差D(x)=σ2D(x)=σ^2D(x)=σ2

均值μ表示正态分布的左右偏移,标准差σ决定曲线的宽度和平坦,标准差σ越大曲线越平坦。
在这里插入图片描述
正态分布性质
如果独立随机变量X和Y符合正态分布,那么X+Y也符合正态分布。如果正态分布X~N(μ, σ²)中,Y是一个线性变换的形式aX+b,因为X符合正态分布,所以aX+b也符合正态分布。
在这里插入图片描述

2.3 其他分布

  • Z分布:就是标准的正态分布,普通的正态分布经过Z得分能够得到Z分布;

  • t分布:又叫学生分布,是小样本分布,当t分布随着自由度v的增大越来越趋近于正态分布。
    在这里插入图片描述

  • F分布:两个独立变量组成的概率密度分布。
    在这里插入图片描述

  • 卡方分布:卡方分布通常用于假设检验,特别是拟合优度的卡方检验。
    在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIGC人工智残

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值