概率统计——随机事件与随机变量
随机事件
基本概念
名词 | 符号 | 概念 |
---|---|---|
随机现象 | 现实生活中,一个动作或事情,在一定条件下,所得的结果不能预先完全确定,只能确定是多种可能结果中的一种的现象。 | |
随机试验 | E | 使随机现象得以实现和对它观察的全过程称为随机试验。 |
样本空间 | Ω | 随机试验所有可能结果组成的集合 |
样本点 | ω | 试验的每一个可能结果 |
随机事件 | A, B, C, …… | 样本空间中满足一定条件的子集。 |
事件发生 | 在试验中,称一个事件发生是指构成该事件的一个样本点出现。 | |
必然事件 | 由于样本空间Ω包含了所有的样本点,所以在每次试验中,样本空间总是发生,因此称Ω为必然事件 | |
不可能事件 | 空集不包含任何样本点,且在每次试验中总不发生,所以称为不可能事件。 |
【注意】:
- 随机试验需要满足三个条件:q
(1)可以在相同条件下重复进行;
(2)结果有多种可能性,并且所有可能结果事先已经知道;
(3)做一次试验究竟哪个结果出现,事先不能确定。 - 随机事件在随机试验中可能出现,也可能不出现。
【举例说明】:掷色子。
- 样本点:出现的“1,2,3,4,5,6”中的任何一个数字都是一个样本点。
- 样本空间:所有样本点的集合,即Ω={1,2,3,4,5,6}.
- 随机事件(在一定条件下):出现数字是偶数的结果,A={2,4,6}.
- A是Ω的一个子集。
- 不可能事件:出现的结果大于6。用空集表示。
概率
定义
随机试验E的样本空间为Ω,对于每一个事件A,定义一个实数P(A)与之对应,若函数P(.)满足条件:
- 对于每一个事件A,都有0<P(A)≤1;
- P(Ω)=1;
- 若事件 A 1 , A 2 , A 3 , … A_1,A_2,A_3,… A1,A2,A3,…两两互斥,即,当i,j=1,2,…,且i≠j, A i ∩ A j = ∅ A_i∩A_j=∅ Ai∩Aj=∅时,均有 P ( A 1 ∪ A 2 ∪ … ) = P ( A 1 ) + P ( A 2 ) + … P(A_1∪A_2∪…)=P(A_1)+P(A_2)+… P(A1∪A2∪…)=P(A1)+P(A2)+…
则称P(A)为事件A的概率。
主要性质
- 对于任一事件A,均有 P ( A ˉ ) = 1 − P ( A ) P(\bar{A})=1-P(A) P(Aˉ)=1−P(A);
- 对于两个事件A和B,若 A ⊂ B A\subset B A⊂B,则有 P ( B − A ) = P ( B ) − P ( A ) , P ( B ) > P ( A ) P(B-A)=P(B)-P(A),P(B)>P(A) P(B−A)=P(B)−P(A),P(B)>P(A);
- 对于任意两个事件A和B,有 P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A\cup B)=P(A)+P(B)-P(A\cap B) P(A∪B)=P(A)+P(B)−P(A∩B)
【举例说明】:掷色子,每个数字出现的概率是 1 6 \frac {1} {6} 61。令A={1,2},B={1,2,3}, A ˉ \bar A Aˉ={3,4,5,6}。 P ( A ) = 1 3 , P ( B ) = 1 2 P(A)=\frac {1} {3},P(B)=\frac {1} {2} P(A)=31,P(B)=21。
- P ( A ˉ ) = 1 − P ( A ) = 1 − 1 3 = 2 3 P(\bar A)=1-P(A)=1-\frac {1} {3}=\frac {2} {3} P(Aˉ)=1−P(A)=1−31=32
- P ( B − A ) = P ( B ) − P ( A ) = 1 2 − 1 3 = 1 6 P(B-A)=P(B)-P(A)=\frac {1} {2}-\frac {1} {3}=\frac {1} {6} P(B−A)=P(B)−P(A)=21−31=61
- P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) = 1 3 + 1 2 − 1 3 = 1 2 , 其 中 A ∩ B = A . P(A\cup B)=P(A)+P(B)-P(A\cap B)=\frac {1} {3}+\frac {1} {2}-\frac {1} {3}=\frac {1} {2},其中A\cap B=A. P(A∪B)=P(A)+P(B)−P(A∩B)=31+21−31=21,其中A∩B=A.
古典概型
古典概型公式
样
本
空
间
Ω
=
n
,
事
件
A
包
含
m
个
样
本
点
,
则
事
件
A
的
概
率
定
义
为
:
样本空间\Omega=n,事件A包含m个样本点,则事件A的概率定义为:
样本空间Ω=n,事件A包含m个样本点,则事件A的概率定义为:
P
(
A
)
=
m
n
=
事
件
A
包
含
的
基
本
事
件
数
基
本
事
件
总
数
P(A)=\frac {m} {n}=\frac {事件A包含的基本事件数} {基本事件总数}
P(A)=nm=基本事件总数事件A包含的基本事件数
浅析排列组合
排列和组合的本质区别:决策的顺序对结果有没有影响。
排列(Arrangement)
- 排列的定义:
- 从n个不同元素中,任取m(m≤n,m与n均为自然数,下同)个不同的元素按照一定的顺序排成一列,叫做从n个不同元素中取出m个元素的一个排列;
- 从n个不同元素中取出m(m≤n)个元素的所有排列的个数,叫做从n个不同元素中取出m个元素的排列数,用符号 A n m A_n^m Anm表示。
- 计算公式:
- A n m = n ( n − 1 ) ( n − 2 ) ( n − 3 ) ⋯ ( n − m + 1 ) = n ! ( n − m ) ! A_n^m=n(n-1)(n-2)(n-3)\cdots(n-m+1)=\frac {n!} {(n-m)!} Anm=n(n−1)(n−2)(n−3)⋯(n−m+1)=(n−m)!n!
组合(Combination)
- 组合的定义:
- 从n个不同元素中,任取m(m≤n)个元素并成一组,叫做从n个不同元素中取出m个元素的一个组合;
- 从n个不同元素中取出m(m≤n)个元素的所有组合的个数,叫做从n个不同元素中取出m个元素的组合数。用符号 C n m C_n^m Cnm表示。
- 计算公式:
- C n m = A n m m ! = n ! m ! ( n − m ) ! ; C n m = C n n − m C_n^m=\frac {A_n^m} {m!}=\frac {n!} {m!(n-m)!};C_n^m=C_n^{n-m} Cnm=m!Anm=m!(n−m)!n!;Cnm=Cnn−m
例题
假设有k个不同颜色的球,每个球以同样的概率 1 l \frac {1} {l} l1落到 l ( l ≥ k ) l(l \ge k) l(l≥k)个格子的每个中,且每个盒子可以容纳任意多个球。分别求出以下两个事件A和B的概率。
- 指定的k个格子中各有一个球;
- 存在k个格子,其中各有一个球。
【解析】:
- 由于每个格子可以放任意个球,所以k个球放入一个格子里面就有k种可能,一共有 l l l个格子,所以样本空间就是 l k l^k lk。
- A事件的意思就是在 l l l个格子中选出k个格子来放k个球,也就是 A k k A_k^k Akk。所以, P ( A ) = A k k l k P(A)=\frac {A_k^k} {l^k} P(A)=lkAkk。
- 对于B事件,首先我们要从 l l l个格子里面随机选出k个格子,也就是 C l k C_l^k Clk,其次,选出的k个格子要放k个球,也就是 A k k A_k^k Akk,即一共是 C l k × A k k C_l^k×A_k^k Clk×Akk,从而得知, P ( B ) = C l k × A k k l k P(B)=\frac {C_l^k×A_k^k} {l^k} P(B)=lkClk×Akk。
条件概率
设
A
和
B
是
两
个
事
件
,
且
P
(
B
)
>
0
,
称
P
(
A
∣
B
)
=
P
(
A
B
)
P
(
B
)
,
为
事
件
B
发
生
的
条
件
下
,
事
件
A
发
生
的
概
率
。
设A和B是两个事件,且P(B)>0,称P(A|B)=\frac {P(AB)} {P(B)},为事件B发生的条件下,事件A发生的概率。
设A和B是两个事件,且P(B)>0,称P(A∣B)=P(B)P(AB),为事件B发生的条件下,事件A发生的概率。
由此推导出,概率的乘法公式为:
P
(
A
B
)
=
P
(
A
∣
B
)
P
(
B
)
=
P
(
B
∣
A
)
P
(
A
)
P(AB)=P(A|B)P(B)=P(B|A)P(A)
P(AB)=P(A∣B)P(B)=P(B∣A)P(A)
全概率公式
设
B
1
,
B
2
,
⋯
是
样
本
空
间
Ω
的
一
个
划
分
,
A
为
任
一
事
件
,
则
设B_1,B_2,\cdots是样本空间\Omega的一个划分,A为任一事件,则
设B1,B2,⋯是样本空间Ω的一个划分,A为任一事件,则
P
(
A
)
=
∑
i
=
1
∞
P
(
B
i
)
P
(
A
∣
B
i
)
,
P(A)=\sum_{i=1}^{\infty}P(B_i)P(A|B_i),
P(A)=i=1∑∞P(Bi)P(A∣Bi),
称
为
全
概
率
公
式
。
称为全概率公式。
称为全概率公式。
【补充】:
如果事件组满足
B
1
,
B
2
,
⋯
B_1,B_2,\cdots
B1,B2,⋯两两互斥,且
P
(
B
i
)
>
0
,
i
=
1
,
2
,
⋯
,
B
1
∪
B
2
∪
⋯
=
Ω
,
则
称
事
件
组
B
1
,
B
2
,
⋯
是
样
本
空
间
Ω
的
一
个
划
分
。
P(B_i)>0,i=1,2,\cdots,B_1\cup B_2\cup\cdots=\Omega,则称事件组B_1,B_2,\cdots是样本空间\Omega的一个划分。
P(Bi)>0,i=1,2,⋯,B1∪B2∪⋯=Ω,则称事件组B1,B2,⋯是样本空间Ω的一个划分。
【本质】
全
概
率
就
是
表
示
达
到
某
个
目
的
,
有
多
种
方
式
(
或
者
造
成
某
种
结
果
,
有
多
种
原
因
)
,
问
达
到
目
的
的
概
率
是
多
少
(
造
成
这
种
结
果
的
概
率
是
多
少
)
?
\color {red}{全概率就是表示达到某个目的,有多种方式(或者造成某种结果,有多种原因),问达到目的的概率是多少(造成这种结果的概率是多少)?}
全概率就是表示达到某个目的,有多种方式(或者造成某种结果,有多种原因),问达到目的的概率是多少(造成这种结果的概率是多少)?
贝叶斯公式
设
B
1
,
B
2
,
⋯
是
样
本
空
间
Ω
的
一
个
划
分
,
则
对
任
一
事
件
A
(
P
(
A
)
>
0
)
有
设B_1,B_2,\cdots是样本空间\Omega的一个划分,则对任一事件A(P(A)>0)有
设B1,B2,⋯是样本空间Ω的一个划分,则对任一事件A(P(A)>0)有
P
(
B
i
∣
A
)
=
P
(
B
i
A
)
P
(
A
)
=
P
(
A
∣
B
i
)
P
(
B
i
)
∑
j
=
1
∞
P
(
B
j
)
P
(
A
∣
B
j
)
,
i
=
1
,
2
,
⋯
P(B_i|A)=\frac {P(B_iA)} {P(A)}=\frac {P(A|B_i)P(B_i)} {\sum_{j=1}^{\infty}P(B_j)P(A|B_j)},i=1,2,\cdots
P(Bi∣A)=P(A)P(BiA)=∑j=1∞P(Bj)P(A∣Bj)P(A∣Bi)P(Bi),i=1,2,⋯
称上式为贝叶斯公式,称
P
(
B
i
)
(
i
=
1
,
2
,
⋯
)
P(B_i)(i=1,2,\cdots)
P(Bi)(i=1,2,⋯)为先验概率,
P
(
B
i
∣
A
)
(
i
=
1
,
2
,
⋯
)
P(B_i|A)(i=1,2,\cdots)
P(Bi∣A)(i=1,2,⋯)为后验概率。
【本质】
贝
叶
斯
公
式
就
是
当
已
知
结
果
,
问
导
致
这
个
结
果
的
第
i
原
因
的
可
能
性
是
多
少
?
执
果
索
因
!
\color {red}{贝叶斯公式就是当已知结果,问导致这个结果的第i原因的可能性是多少?执果索因!}
贝叶斯公式就是当已知结果,问导致这个结果的第i原因的可能性是多少?执果索因!
随机变量
随机变量&&随机变量的分布函数
随机变量
设E是随机试验, Ω \Omega Ω是样本空间,如果对于每一个 ω ⊂ Ω \omega \subset \Omega ω⊂Ω。都有一个确定的实数 X ( ω ) X(\omega) X(ω)与之对应,若对于任意实数 x ⊂ R x\subset R x⊂R,有{ ω : X ( ω ) < x \omega :X(\omega) <x ω:X(ω)<x},则称 Ω \Omega Ω上的单值实函数 X ( ω ) X(\omega) X(ω)为一个随机变量。
随机变量的分布函数
设
X
是
一
个
随
机
变
量
,
对
于
任
意
实
数
x
,
令
设X是一个随机变量,对于任意实数x,令
设X是一个随机变量,对于任意实数x,令
F
(
x
)
=
{
X
<
x
}
,
x
∈
R
F(x)=\lbrace{X<x} \rbrace,x\in R
F(x)={X<x},x∈R
称
F
(
x
)
为
随
机
变
量
X
的
分
布
函
数
,
也
称
为
概
率
累
计
函
数
。
称F(x)为随机变量X的分布函数,也称为概率累计函数。
称F(x)为随机变量X的分布函数,也称为概率累计函数。
离散型随机变量
如 果 随 机 变 量 X 的 全 部 可 能 取 值 只 有 有 限 多 个 或 可 列 无 穷 多 个 , 则 称 X 为 离 散 型 随 机 变 量 。 如果随机变量X的全部可能取值只有有限多个或可列无穷多个,则称X为离散型随机变量。 如果随机变量X的全部可能取值只有有限多个或可列无穷多个,则称X为离散型随机变量。
对
于
离
散
型
随
机
变
量
X
可
能
取
值
为
x
k
的
概
率
为
:
对于离散型随机变量X可能取值为x_k的概率为:
对于离散型随机变量X可能取值为xk的概率为:
P
{
X
=
x
k
}
=
p
k
,
k
=
1
,
2
,
⋯
P\lbrace{X=x_k}\rbrace=p_k,k=1,2,\cdots
P{X=xk}=pk,k=1,2,⋯
则
称
上
式
为
离
散
型
随
机
变
量
X
的
分
布
律
。
则称上式为离散型随机变量X的分布律。
则称上式为离散型随机变量X的分布律。
离
散
性
随
机
变
量
的
分
布
函
数
为
:
离散性随机变量的分布函数为:
离散性随机变量的分布函数为:
F
(
x
)
=
P
{
X
<
=
x
}
=
∑
x
k
<
=
x
P
{
X
=
x
k
}
=
∑
x
k
<
=
x
P
k
F(x)=P\lbrace{X<=x}\rbrace=\sum_{x_k<=x}P\lbrace{X=x_k}\rbrace=\sum_{x_k<=x}P_k
F(x)=P{X<=x}=xk<=x∑P{X=xk}=xk<=x∑Pk
常见的离散型分布
二项分布(Bernoulli分布)
- Bernoulli(伯努利)试验
如果一个随机试验只有两种可能结果 A 和 A ˉ A和\bar A A和Aˉ,并且
P ( A ) = p , P ( A ˉ ) = 1 − p = q P(A)=p,P(\bar A)=1-p=q P(A)=p,P(Aˉ)=1−p=q
其 中 , 0 < p < 1 , 则 称 此 实 验 为 B e r n o u l l i 试 验 。 B e r n o u l l i 试 验 重 复 进 行 n 次 , 称 为 n 重 B e r n o u l l i 试 验 。 其中,0<p<1,则称此实验为Bernoulli试验。Bernoulli试验重复进行n次,称为n重Bernoulli试验。 其中,0<p<1,则称此实验为Bernoulli试验。Bernoulli试验重复进行n次,称为n重Bernoulli试验。 - 二项分布
设 A = { n 重 B e r n o u l l i 试 验 中 A 出 现 k 次 } , 则 设A=\lbrace{n重Bernoulli试验中A出现k次}\rbrace,则 设A={n重Bernoulli试验中A出现k次},则
P ( A k ) = C n k P k ( 1 − p ) n − k , k = 0 , 1 , 2 , ⋯ , n P(A_k)=C_n^kP^k(1-p)^{n-k},k=0,1,2,\cdots,n P(Ak)=CnkPk(1−p)n−k,k=0,1,2,⋯,n
此 为 二 项 分 布 , 记 作 B ( n , k ) 。 此为二项分布,记作B(n,k)。 此为二项分布,记作B(n,k)。 - 分布函数
若 随 机 变 量 X 的 分 布 律 为 : P ( X = k ) = C n k P k ( 1 − p ) n − k , k = 0 , 1 , 2 , ⋯ , n , 其 分 布 函 数 为 : 若随机变量X的分布律为:P(X=k)=C_n^kP^k(1-p)^{n-k},k=0,1,2,\cdots,n,其分布函数为: 若随机变量X的分布律为:P(X=k)=CnkPk(1−p)n−k,k=0,1,2,⋯,n,其分布函数为:
F ( x ) = ∑ k = ⌊ x ⌋ C n k P k ( 1 − p ) n − k , k = 0 , 1 , 2 , ⋯ , n F(x)=\sum_{k=}^{\lfloor x \rfloor}C_n^kP^k(1-p)^{n-k},k=0,1,2,\cdots,n F(x)=k=∑⌊x⌋CnkPk(1−p)n−k,k=0,1,2,⋯,n
其 中 ⌊ x ⌋ 表 示 向 下 取 整 , 即 不 超 过 x 的 最 大 整 数 。 其中\lfloor x \rfloor 表示向下取整,即不超过x的最大整数。 其中⌊x⌋表示向下取整,即不超过x的最大整数。
随机变量的数字特征
数学期望(均值)——离散型/连续型
- 离散型:
设 离 散 型 随 机 变 量 X 的 分 布 律 为 P ( X = x i ) = p i , i = 1 , 2 , ⋯ , 若 级 数 ∑ i ∣ x i ∣ p i 收 敛 , 则 称 级 数 ∑ i x i p i 的 和 为 随 机 变 量 X 的 数 学 期 望 。 记 作 E ( X ) , 即 : 设离散型随机变量X的分布律为P(X=x_i)=p_i,i=1,2,\cdots,若级数\sum_i|x_i|p_i收敛,则称级数\sum_ix_ip_i的和为随机变量X的数学期望。记作E(X),即: 设离散型随机变量X的分布律为P(X=xi)=pi,i=1,2,⋯,若级数∑i∣xi∣pi收敛,则称级数∑ixipi的和为随机变量X的数学期望。记作E(X),即:
E ( X ) = ∑ i x i p i E(X)=\sum_ix_ip_i E(X)=i∑xipi - 连续型:
设 连 续 型 随 机 变 量 X 的 概 率 密 度 函 数 为 f ( x ) , 若 积 分 ∫ − ∞ + ∞ ∣ x ∣ f ( x ) d x 的 值 为 随 机 变 量 X 的 数 学 期 望 。 记 作 E ( X ) , 即 : 设连续型随机变量X的概率密度函数为f(x),若积分\int_{-\infty}^{+\infty}{|x|f(x)}dx的值为随机变量X的数学期望。记作E(X),即: 设连续型随机变量X的概率密度函数为f(x),若积分∫−∞+∞∣x∣f(x)dx的值为随机变量X的数学期望。记作E(X),即:
E ( X ) = ∫ − ∞ + ∞ x f ( x ) d x E(X)=\int_{-\infty}^{+\infty}{xf(x)}dx E(X)=∫−∞+∞xf(x)dx
【注意】:数学期望代表了随机变量取值的平均值,是一个非常重要的数学特征。
【数学期望的特征】:
- 若 c 是 常 数 , 则 E ( c ) = c ; 若c是常数,则E(c)=c; 若c是常数,则E(c)=c;
- E ( a X + b Y ) = a E ( X ) + b E ( Y ) , 其 中 a , b 是 任 意 常 数 ; E(aX+bY)=aE(X)+bE(Y),其中a,b是任意常数; E(aX+bY)=aE(X)+bE(Y),其中a,b是任意常数;
- 若 X , Y 相 互 独 立 , 则 E ( X Y ) = E ( X ) E ( Y ) ; 若X,Y相互独立,则E(XY)=E(X)E(Y); 若X,Y相互独立,则E(XY)=E(X)E(Y);
方差、均方差(标准差)、协方差、相关系数
- 方差、均方差(标准差):
设 X 为 随 机 变 量 , 如 果 E { [ X − E ( X ) ] 2 } 为 X 的 设X为随机变量,如果E\lbrace{[X-E(X)]^2}\rbrace为X的 设X为随机变量,如果E{[X−E(X)]2}为X的方差。 记 作 V a r ( X ) , 即 : 记作Var(X),即: 记作Var(X),即:
V a r ( X ) = E { [ X − E ( X ) ] 2 } Var(X)=E\lbrace{[X-E(X)]^2}\rbrace Var(X)=E{[X−E(X)]2}
并 且 称 V a r ( X ) 为 X 的 并且称\sqrt {Var(X)}为X的 并且称Var(X)为X的标准差 或 均方差。
【注意】:方差是用来描述随机变量取值相对于均值的离散程度的一个量,是非常重要的数字特征。
【方差的性质】:
- 若 c 是 常 数 , 则 V a r ( c ) = 0 若c是常数,则Var(c)=0 若c是常数,则Var(c)=0
- V a r ( a X + b ) = a 2 E ( X ) , 其 中 a , b 是 任 意 常 数 ; Var(aX+b)=a^2E(X),其中a,b是任意常数; Var(aX+b)=a2E(X),其中a,b是任意常数;
- 若 X , Y 相 互 独 立 , 则 V a r ( X + Y ) = V a r ( X ) + V a r ( Y ) ; 若X,Y相互独立,则Var(X+Y)=Var(X)+Var(Y); 若X,Y相互独立,则Var(X+Y)=Var(X)+Var(Y);
- 协方差:
协方差和相关系数 都 是 描 述 随 机 变 量 X 与 随 机 变 量 Y 之 间 的 线 性 联 系 程 度 的 数 字 量 。 都是描述随机变量X与随机变量Y之间的线性联系程度的数字量。 都是描述随机变量X与随机变量Y之间的线性联系程度的数字量。
设
X
,
Y
为
两
个
随
机
变
量
,
称
E
{
[
X
−
E
(
X
)
]
[
Y
−
E
(
Y
)
]
}
为
X
和
Y
的
协
方
差
,
记
作
C
o
v
(
X
,
Y
)
,
即
:
设X,Y为两个随机变量,称E\lbrace{[X-E(X)][Y-E(Y)]}\rbrace为X和Y的协方差,记作Cov(X,Y),即:
设X,Y为两个随机变量,称E{[X−E(X)][Y−E(Y)]}为X和Y的协方差,记作Cov(X,Y),即:
C
o
v
(
X
,
Y
)
=
E
{
[
X
−
E
(
X
)
]
[
Y
−
E
(
Y
)
]
}
Cov(X,Y)=E\lbrace{[X-E(X)][Y-E(Y)]}\rbrace
Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}
【协方差的性质】:
- C o v ( X , Y ) = C o v ( Y , X ) ; Cov(X,Y)=Cov(Y,X); Cov(X,Y)=Cov(Y,X);
- C o v ( a X + b , c Y + d ) = a c C o v ( X , Y ) , 其 中 a , b , c , d 为 任 意 常 数 ; Cov(aX+b,cY+d)=acCov(X,Y),其中a,b,c,d为任意常数; Cov(aX+b,cY+d)=acCov(X,Y),其中a,b,c,d为任意常数;
- C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) ; Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y); Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y);
- C o v ( X , Y ) = E ( X , Y ) − E ( X ) E ( Y ) ; Cov(X,Y)=E(X,Y)-E(X)E(Y); Cov(X,Y)=E(X,Y)−E(X)E(Y);
- 当 X , Y 相 互 独 立 时 , C o v ( X , Y ) = 0 ; 当X,Y相互独立时,Cov(X,Y)=0; 当X,Y相互独立时,Cov(X,Y)=0;
- ∣ C o v ( X , Y ) ∣ = V a r ( X ) V a r ( Y ) ; |Cov(X,Y)|=\sqrt {Var(X)}\sqrt {Var(Y)}; ∣Cov(X,Y)∣=Var(X)Var(Y);
- C o v ( X , X ) = V a r ( X ) ; Cov(X,X)=Var(X); Cov(X,X)=Var(X);
- 相关系数:
当 V a r ( X ) > 0 , V a r ( Y ) > 0 时 , 称 : 当\sqrt {Var(X)}>0,\sqrt {Var(Y)}>0时,称: 当Var(X)>0,Var(Y)>0时,称:
ρ ( X , Y ) = C o v ( X , Y ) V a r ( X ) V a r ( Y ) \rho(X,Y)=\frac {Cov(X,Y)}{\sqrt {Var(X)}\sqrt {Var(Y)}} ρ(X,Y)=Var(X)Var(Y)Cov(X,Y)
为 X , Y 的 相 关 系 数 , 它 是 无 纲 量 的 量 , 也 就 是 没 有 单 位 。 为X,Y的相关系数,它是无纲量的量,也就是没有单位。 为X,Y的相关系数,它是无纲量的量,也就是没有单位。
【补充】:- 用相关系数来衡量两个变量之间的相关程度。
- 相关系数在**-1到1之间,小于0表示负相关**,大于0表示正相关。
- 绝对值 ∣ ρ ( X , Y ) ∣ |\rho(X,Y)| ∣ρ(X,Y)∣表示相关度的大小,越接近1,相关度越大。