4.5 方差
定义
- 方差是衡量随机变量取值相对于均值离散程度的重要指标。
- 若随机变量 $ X $ 的期望为 $ \mu = E[X] $,则 $ X $ 的方差记为 $ Var(X) $,定义为:
Var(X)=E[(X−μ)2] Var(X) = E[(X - \mu)^2] Var(X)=E[(X−μ)2]
方差的等价计算公式:
Var(X)=E[(X−μ)2]=∑x(x−μ)2p(x)=∑x(x2−2μx+μ2)p(x)=∑xx2p(x)−2μ∑xxp(x)+μ2∑xp(x)=E[X2]−2μ2+μ2=E[X2]−μ2 \begin{aligned} Var(X) &= E[(X - \mu)^2] = \sum_x (x - \mu)^2 p(x) \\ &= \sum_x (x^2 - 2\mu x + \mu^2) p(x) \\ &= \sum_x x^2 p(x) - 2\mu \sum_x x p(x) + \mu^2 \sum_x p(x) \\ &= E[X^2] - 2\mu^2 + \mu^2 = E[X^2] - \mu^2 \end{aligned} Var(X)=E[(X−μ)2]=x∑(x−μ)2p(x)=x∑(x2−2μx+μ2)p(x)=x∑x2p(x)−2μx∑xp(x)+μ2x∑p(x)=E[X2]−2μ2+μ2=E[X2]−μ2
即:
Var(X)=E[X2]−(E[X])2(5.1) \boxed{Var(X) = E[X^2] - (E[X])^2} \tag{5.1} Var(X)=E[X2]−(E[X])2(5.1)
例如:考虑三个随机变量 $ W, Y, Z $:
- $ W = 0 $(常数)
- $ Y = \begin{cases} -1 & \text{概率 } 1/2 \ +1 & \text{概率 } 1/2 \end{cases} $
- $ Z = \begin{cases} -100 & \text{概率 } 1/2 \ +100 & \text{概率 } 1/2 \end{cases} $
三者期望值均为 0,但方差分别为:
- $ Var(W) = 0 $
- $ Var(Y) = 1 $
- $ Var(Z) = 10000 $
方差反映了取值离散程度的不同。
性质
定理 5.1
对于任意常数 $ a $ 和 $ b $,有:
Var(aX+b)=a2Var(X)(5.2) \boxed{Var(aX + b) = a^2 Var(X)} \tag{5.2} Var(aX+b)=a2Var(X)(5.2)
证明:
-
令 $ \mu = E[X] $,由推论 4.1 知 $ E[aX + b] = a\mu + b $
-
因此:
Var(aX+b)=E[(aX+b−aμ−b)2]=E[a2(X−μ)2]=a2E[(X−μ)2]=a2Var(X) \begin{aligned} Var(aX + b) &= E[(aX + b - a\mu - b)^2] \\ &= E[a^2(X - \mu)^2] \\ &= a^2E[(X - \mu)^2] \\ &= a^2Var(X) \end{aligned} Var(aX+b)=E[(aX+b−aμ−b)2]=E[a2(X−μ)2]=a2E[(X−μ)2]=a2Var(X)
[!NOTE]
方差不受常数项影响,但会受比例因子的平方影响。这表明方差衡量的是数据的"分散程度",而不是位置。
标准差
-
标准差(Standard Deviation)是方差的平方根,记为 $ SD(X) $:
SD(X)=Var(X) SD(X) = \sqrt{Var(X)} SD(X)=Var(X) -
标准差与原始数据具有相同的量纲,更便于解释。
例题
例 5a:掷骰子方差计算
设 $ X $ 表示掷一枚均匀骰子出现的点数,计算 $ Var(X) $。
-
由例 3a 知 $ E[X] = \frac{7}{2} $
-
计算 $ E[X^2] $:
E[X2]=12×16+22×16+32×16+42×16+52×16+62×16=916 E[X^2] = 1^2 \times \frac{1}{6} + 2^2 \times \frac{1}{6} + 3^2 \times \frac{1}{6} + 4^2 \times \frac{1}{6} + 5^2 \times \frac{1}{6} + 6^2 \times \frac{1}{6} = \frac{91}{6} E[X2]=12×61+22×61+32×61+42×61+52×61+62×61=691 -
应用公式 (5.1):
Var(X)=916−(72)2=916−494=3512 Var(X) = \frac{91}{6} - \left(\frac{7}{2}\right)^2 = \frac{91}{6} - \frac{49}{4} = \frac{35}{12} Var(X)=691−(27)2=691−449=1235
4.6 伯努利随机变量和二项随机变量
伯努利随机变量
-
伯努利随机变量表示一次试验的结果(成功或失败):
X={ 1if 成功0if 失败 X = \begin{cases} 1 & \text{if 成功} \\ 0 & \text{if 失败} \end{cases} X={ 10if 成功if 失败 -
分布列为:
p(0)=P(X=0)=1−p,p(1)=P(X=1)=p p(0) = P(X = 0) = 1 - p, \quad p(1) = P(X = 1) = p p(0)=P(X=0)=1−p,p(1)=P(X=1)=p
其中 $ 0 \leq p \leq 1 $ 是每次试验成功的概率。 -
伯努利随机变量是参数为 $ (1, p) $ 的二项随机变量的特例。
二项随机变量
-
二项随机变量表示 $ n $ 次独立重复伯努利试验中成功的次数。
-
若 $ X $ 是参数为 $ (n, p) $ 的二项随机变量,则其分布列为:
p(i)=(ni)pi(1−p)n−ii=0,1,⋯ ,n(6.2) \boxed{p(i) = \binom{n}{i} p^{i} (1-p)^{n-i} \qquad i = 0, 1, \cdots, n} \tag{6.2} p(i)=(in)pi(1−p)n−ii=0,1,⋯,n(6.2) -
由二项式定理可知概率和为 1:
∑i=0n(ni)pi(1−p)n−i=[p+(1−p)]n=1 \sum_{i=0}^{n} \binom{n}{i} p^{i} (1-p)^{n-i} = [p + (1-p)]^{n} = 1 i=0∑n(in)pi(1−p)n−i=[p+(1−p)]n=

最低0.47元/天 解锁文章
742

被折叠的 条评论
为什么被折叠?



