统计-随机变量

本文介绍了随机变量的基本概念,包括离散型与连续型随机变量、概率分布及常见分布类型如0-1分布、二项分布、泊松分布、几何分布、超几何分布、均匀分布、指数分布和正态分布等,并探讨了随机变量函数的分布。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

随机变量

定义

设随机试验E的样本空间为S={e},若X=X(e)是定义在样本空间S的上的一个单值实函数,则称X=X(e)为随机变量
简单说,让每一个样本点e对应着唯一的实数X(e),便得到随机变量X=X(e)

离散型随机变量

若随机变量只可能取有限个或可数无限个值时

连续型随机变量

若随机变量只可能取一个区间中的所有实数时

随机变量的概率

随机变量X取某个值x的事件用记号{X=x}表示,其概率记为{X=x}
若L是一个实数集,将随机变量X在L中取值的事件记作{X∈L},其概率记为P{XL}
P{X∈L}=P{e|X(e)∈L}

离散型随机变量及其分布律

设离散型随机变量X所有可能的取值为xk,X取xk的概率为P{X=xk}=pk (k=1,2,…)

性质

1.非负性 Pk≥0,k=1,2,…
2.规范性 p1+p2+…+pn =1

分布律
xx1 x2 … xk
pkp1 p2 … pk

k=1Pk=1∑k=1∞Pk=1

X的每一个取值各占一些概率,这些概率加起来为1,即概率1以一定的规律分布着各个可能的值上。

0-1分布

定义

只取0和1两个值的随机变量所服从的分布称为0-1分布
设P{X=1}= p (0 < p <1) ,则P{X=0}=1-p
PX=k=pk(1p)1k(k=0,1)PX=k=pk(1−p)1−k(k=0,1)

x0 1
p_k1-p p

二项分布

设X表示n重伯努利试验中事件A发生的次数,则X是一个随机变量,X可能的取值为0,1,…,n。
用Ai表示事件A在第i次试验中发生(i=0,1,…,n)
假设A发生在第n1,..,nk次的试验,
这k次试验A发生概率为P(A1A1¯An1An−1¯ An An+1An+1¯Ak1Ak−1¯ Ak Ak+1Ak+1¯)=(1-p)…(1-p)p(1-p)…(1-p)p(1-p)…(1-p)=pk(1-p)n-k
由于A发生在哪k次试验有CknCnk

公式

P{X=k}=CknCnkpk(1-p)n-k
随机变量X服从参数n,p的二项分布,记为X~b(n,p)

规范性
k=0nCkn∑k=0nCnkpk(1-p)n-k=[p+(1-p)]n=1

二项分布为0-1分布b(1,p)
P{X=k}=pk(1-p)n-k (k=0,1) (C_0^1==C_1^1$=1)

例子

某人进行射击,每次射中命中率0。02,独立射击400次,至少中两次概率
P~b(400,0.02)
P{X=k}=C400k0.02k(1-0.02)400-k
P{X≥2}=1-P{X=0}-P{X=1}
=1-C4000C40000.020(1-0.02)400-0-C4000C40000.021(1-0.02)400-1=0.9972

泊松分布

知道发生的的平均次数λλ
P=λnP=λn
X~b(n,λnλn)推出

limn+Ckn(λn)k(1λn)nk=λkk!eλlimn→+∞Cnk(λn)k(1−λn)n−k=λkk!e−λ
定义

设随机变量X所以可能的取值为一起自然数0,1,2…,且取值k(k=0,1,2,..)的概率为

PkPk= P{X=k} = λkk!eλλkk!e−λ
其中λλ>0的常数,则称X服从参数为λλ的泊松分布。X~π(\lambda)

可以通过泊松分布表计算

规范性

例子

保险公司承保5000张同年龄为期一年的保单。如果合同期死亡,则赔付3万元。设1年内死亡概率为0.0015,且投保人是互为独立时间。求保险公司对于这批保险人赔付不超过30w的概率
X~b(5000,0.0015)
总赔付额为3X万元
求概率P{3X≤30}=P{X≤10}
二项分布
P{X≤10}=k=010Ck5000∑k=010C5000k0.0015k(1-0.0015)5000-k

计算困难,用泊松分布
\lambda=np=5000×0.0015=7.5
P{X≤10}=k=0107.5kk!e7.5∑k=0107.5kk!e−7.5
直接查表

几何分布 试验直到成功的概率

用Ai表示事件A在第i次试验中发生(i=0,1,…,n)假设第kci试验中A第一次发生,则
P{X=k}=P(A1A1¯Ak1Ak−1¯ Ak)=(1-p)…(1-p)p=(1-p)k-1p

定义

设多重伯努利试验中,事件A发生的概率为p(0 < p < 1),记X为A第一次发生时的试验次数,则X取值k的概率
P{X=k}=(1-p)k-1p (k=1,2…)
称X服从参数为p的几何分布,记作X~G(p)

x1 2 … k …
pkp (1-p)p … (1-p)k-1p …

规范性

k=1(1p)k1p=pk=1(1p)k1=p11(1p)=p1p=1∑k=1∞(1−p)k−1p=p∑k=1∞(1−p)k−1=p11−(1−p)=p1p=1
几何级数(等比级数)
等比级数的和=1首项1−公比

超几何分布

设有N件产品,其中有D件次品。今从中任取n件,问其中恰有k件次品(k≤D)的概率是多少?
在N件产品中取n件(不放回)的取法有CnNCNn
在D件次品中取k件的取法有CkDCDk
在N-D件正品中取n-k件的取法有CNDnkCN−Dn−k
在N件产品中取n件,其中恰有k件次品的取法有CkDCDkCNDnkCN−Dn−k
P(A)=CkDCNDnkCnNP(A)=CDkCN−Dn−kCNn

定义

设有N件产品,其中有M件次品。从中任取n件,则其中恰有k件次品(k≤M)的概率是
设随机变量X表示取出n件产品中的次品数,
则P{X=k}={CkMCMkCNMnkCN−Mn−k}\over {CnNCNn} k=0,1,…,n
称X服从参数为n,M,N的超几何分布

与二项分布关系

当N很大时候,超几何分布和二项分布近似

随机变量的分布函数 累积分布函数

分布函数概率

定义

设X是一个随机变量(离散型或连续型),x是任意实数,称事件{X≤x}的概率P{X≤x}为X的分布函数,记作
F(x)=P{X≤x} 定义域整个实数域
对于任何实数x1,x2 (x1 < x2) , 都有P{x1 < X ≤ x2}=P{X ≤ x2}-P{X ≤ x1}=F(x2)-F(x1)

性质1

分布函数F(x)是实数域上(,+−∞,+∞)的单调不减函数

性质2

0≤F(x)≤1
F(−∞)=0 F(++∞)=1

性质3

分布函数F(x)至多有可数个跳跃间断点,且处处都是右连续的,即对任何实数x0,都有
F(X0+0)=limxx0F(x)=F(x0)F(X0+0)=limx→x0F(x)=F(x0)

公式

P{X≤a}=F(a)
P{X<a}=F(a-0)
P{X=a}=F(a)-F(a-0)
P{X>a}=1-F(a)
P{X≥a}=1-F(a-0)
P{a≤X<b}=F(b-0)-F(a-0)
P{a<X<b}=F(b-0)-F(a)
P{a≤X≤b}=F(b)-F(a-0)

离散型随机变量的分布函数

函数概率的累积

连续型随机变量及其密度函数

连续型随机变量及其密度函数的概念

定义

如果随机变量X的分布函数F(x)可以写成以下形式:

F(x)=xf(t)dt(<x<+)F(x)=∫−∞xf(t)dt(−∞<x<+∞)

其中f(x)是定义在(,+)(−∞,+∞)上的非负可积函数,则称X为连续型随机变量,
f(x)称为X的概率密度函数。
性质1

f(x)≥0 非负性

性质2

F(x)=+f(x)dx=1F(x)=∫−∞+∞f(x)dx=1 规范性

性质3

若f(x)在x处联系,则F(x)在x处可导,且
F’(x)=f(x)

性质4

对任意实数x1,x2(x1

均匀分布

定义

若连续随机变量X具有概率密度

f(x)=1baa<x<b0,f(x)={1b−a,a<x<b0,其他

则称X在区间[a,b]上服从均匀分布,记为X~U(a,b
)
意义

若X~U(a,b),则X落在区间(a,b)中任意长度的子区间的可能性是相同的。
随机变量X落入每一个小区间概率都是
1ba1b−a=(ba)nba(b−a)nb−a =1n1n
即落入每一个小区间都是等可能的,所以概率被均匀的分布在区间[a,b]上。

分布函数

f(x)=0x<axabaax<b1,xbf(x)={0,x<ax−ab−a,a≤x<b1,x≥b

指数分布

定义

若连续型随机变量X具有概率密度

f(x)={λeλxx>00,x0(λ>0)f(x)={λe−λx,x>00,x≤0(常数λ>0)

则称X服从参数为λλ的指数分布,记为X~E(λλ)
分布函数

f(x)={1eλxx>00,x0f(x)={1−e−λx,x>00,x≤0
性质 无记忆性

s,t∀s,t>0,有P{X > s+t | X>s}=P{X>t}
在一只X>s发生的条件下,则X>s+t发生的概率就等于{X>t}发生的概率
如,X是一个电子元件的寿命,若已知元件已经使用了s小时(X>s发生),它能再使用t小时(一共使用s+t小时,X>s+t发生)的概率,与它从开始使用起能用t小时的概率相等。
指数分布通常来作为各种寿命的分布

正态分布 高斯分布

若连续型随机变量X具有概率密度
f(x)=12πσ12πσe(xμ)22σ2e−(x−μ)22σ2(<x<+)(−∞<x<+∞)
其中μ,σ(σ>0)μ,σ(σ>0)是常数,则称X服从参数为 μ,σμ,σ的正态分布,记作X~N(μ,σ2μ,σ2)
μμ为X的均值
σσ为方差

图像性质

1.y=f(x)的图形关于直线x=μμ对称。
即f(mumu-h)=f(mumu+h)
2.y=f(x)在x=μμ处的最大值f(μμ)=12πσ12πσ
3.x离μμ越远,f(x)的值越小
4.y=f(x)在x=μ+σμ+σ有两个拐点
5.y=f(x)以x轴为其水平渐近线
6.当σσ固定时,μμ决定y=f(x)的左右位置,μμ称为正态分布的位置参数。
7.当μμ固定是,σσ决定y=f(x)的集中程度。σσ越小,y=f(x)的图形越尖,越高,X落在μμ附件概率越大

分布函数

F(x)=12πσ12πσxe(xμ)22σ2∫x∞e−(x−μ)22σ2
原函数不是初等函数,只能写成积分上限函数

标准正态分布

mumu=0,σσ=1时的正态分布称为标准正态分布,记作X~N(0,1)
φ(x)φ(x)=12π12πex22ex22

标准化

若X~N(μ,σ2μ,σ2)则Z={X-mumu \over σσ}~N{0,1}
F(x)=ϕϕ(xμσx−μσ)

公式

P{X ≤ x}=ϕϕ(xμσx−μσ)
P{|X| ≤ x}=2ϕ(xμσx−μσ)-1
P{x1 < X ≤ x2}=ϕϕ(x2μσx2−μσ)-ϕϕ(x1μσx1−μσ)

随机变量的函数的分布

定义

设g(x)是定义在随机变量X的一切可能取值x的集合上的函数。
如果对于X的每一个可能的取值x,另一个变量Y取值相应的值y=g(x),则称Y为X的函数。记作Y=g(x)

离散型随机变量的函数的分布
连续型随机变量的函数的分布
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值