期望、方差、标准差、协方差、正太分布、分布

概率统计基础:期望、方差、标准差与正太分布解析
本文深入探讨概率统计的基础概念,包括期望的离散与连续分布定义,期望性质;方差的计算及其性质;标准差与协方差的概念及其应用;正太分布的定义、性质,以及与标准正太分布的关系;最后讨论数据分布的图像表示。

1 期望

E X 由 随 机 变 量 X 的 概 率 分 布 确 定 EX由随机变量X的概率分布确定 EXX

1.1 定义

1.1.1 离散分布

p = P { X = x } : X 为 x 的 概 率 为 p E X = ∑ k = 1 x k p k 【 后 者 绝 对 收 敛 】 p=P\{X=x\}:X为x的概率为p\\ EX=\sum_{k=1}{x_kp_k}【后者绝对收敛】 p=P{ X=x}XxpEX=k=1xkpk

1.1.2 连续分布

概 率 密 度 f ( x ) E X = ∫ − ∞ + ∞ x f ( x ) d x 【 后 者 绝 对 收 敛 】 概率密度f(x)\\ EX=\int_{-\infty}^{+\infty}xf(x)dx【后者绝对收敛】 f(x)EX=+xf(x)dx

1.2 期望性质

c 为 常 数 , X , Y 为 随 机 变 量 E ( c ) = c E ( c X ) = c E ( X ) E ( X + Y ) = E X + E Y E ( X Y ) = E X ⋅ E Y 【 当 X , Y 相 互 独 立 时 】 c为常数,X, Y为随机变量\\ E(c)=c\\ E(cX)=cE(X)\\ E(X+Y)=EX+EY\\ E(XY)=EX\cdot EY【当X, Y相互独立时】 cX,YE(c)=cE(cX)=cE(X)E(X+Y)=EX+EYE(XY)=EXEYX,Y

2 方差

随机变量X的分散程度:通过X和其期望EX的偏离程度来体现

2.1 方差定义

D ( X ) = V a r ( X ) = E [ ( X − E X ) 2 ] D(X)=Var(X)=E[(X-EX)^2] D(X)=Var(X)=E[(XEX)2]

2.2 方差性质

c 为 常 数 , X , Y 为 随 机 变 量 D ( c ) = E [ ( c − E ( c ) ) 2 ] = E [ ( c − c ) 2 ] = 0 D ( c X ) = E [ ( c X − E ( c X ) ) 2 ] = c 2 E [ ( X − E ( X ) ) 2 ] = c 2 D ( X ) D ( X ± Y ) = D X + D Y ± E [ ( X − E X ) ( Y − E Y ) ] D ( X ± Y ) = D X + D Y 【 当 X , Y 相 互 独 立 时 , E [ ( X − E X ) ( Y − E Y ) ] = E ( X Y ) − E X ⋅ E Y = 0 】 c为常数,X, Y为随机变量\\ D(c)=E[(c-E(c))^2]=E[(c-c)^2]=0\\ D(cX)=E[(cX-E(cX))^2]=c^2E[(X-E(X))^2]=c^2D(X)\\ D(X\pm Y)=DX+DY\pm E[(X-EX)(Y-EY)]\\ D(X\pm Y)=DX+DY【当X, Y相互独立时,E[(X-EX)(Y-EY)]=E(XY)-EX\cdot EY=0】 cX,YD(c)=E[(cE(c))2]=E[(cc)2]=0D(cX)=E[(cXE(cX))2]=c2E[(XE(X))2]=c2D(X)D(X±Y)=DX+DY±E[(XEX)(YEY)]D(X±Y)=DX+DYX,YE[(XEX

### 方差 (Variance) #### 概念 方差用于衡量一组数据与其均值之间的偏离程度。它是各个数据与均值差的平方的平均数。 #### 计算公式 总体方差: $$ \sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2 $$ 样本方差(无偏估计): $$ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 $$ #### 应用场景 - 评估数据的离散程度。 - 在金融领域中,用于衡量投资风险。 - 是计算标准差协方差和相关系数的基础[^2]。 --- ### 标准差 (Standard Deviation) #### 概念 标准差方差的平方根,表示数据与其均值之间的平均距离,其单位与原始数据一致。 #### 计算公式 $$ \sigma = \sqrt{\sigma^2} $$ #### 应用场景 - 数据标准化(例如Z-score标准化): $$ z = \frac{x - \mu}{\sigma} $$ - 描述正态分布的特征(如68-95-99.7法则)。 - 更直观地反映数据的波动性。 --- ### 协方差 (Covariance) #### 概念 协方差衡量两个变量如何一起变化。正值表示两个变量同向变化,负值表示反向变化。 #### 计算公式 $$ \text{Cov}(X, Y) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y}) $$ #### 应用场景 - 衡量两个变量的线性关系强度。 - 在投资组合管理中,用于分析不同资产的风险联动性。 - 作为构建相关系数矩阵的基础[^4]。 --- ### 相关系数 (Correlation Coefficient) #### 概念 相关系数是标准化后的协方差,消除了变量尺度的影响,取值范围在[-1, 1]之间。绝对值越大,线性相关性越强。 #### 计算公式 $$ r_{XY} = \frac{\text{Cov}(X, Y)}{\sigma_X \cdot \sigma_Y} $$ #### 应用场景 - 比较不同变量对之间的相关性强度。 - 用于统计模型(如回归分析)中评估变量间的关系。 - 避免因变量尺度差异导致的误解[^1]。 --- ### 区别总结 | 特征 | 方差 | 标准差 | 协方差 | 相关系数 | |--------------|--------------------|--------------------|--------------------|--------------------| | **用途** | 衡量单个变量波动性 | 衡量单个变量波动性 | 衡量两个变量共变性 | 衡量两个变量相关性 | | **单位** | 原始单位平方 | 原始单位 | 原始单位乘积 | 无量纲 | | **取值范围** | [0, ∞) | [0, ∞) | (-∞, ∞) | [-1, 1] | --- ### Python 实现示例 ```python import numpy as np data = [2, 4, 6, 8] # 方差 var_pop = np.var(data) # 总体方差 → 5.0 var_sample = np.var(data, ddof=1) # 样本方差 → 6.666... # 标准差 std_pop = np.std(data) # 总体标准差 → 2.236... std_sample = np.std(data, ddof=1) # 样本标准差 → 2.581... # 协方差 x = [1, 2, 3] y = [4, 5, 6] cov_matrix = np.cov(x, y) cov_value = cov_matrix[0, 1] # 协方差值 → 1.0 # 相关系数 corr_matrix = np.corrcoef(x, y) corr_value = corr_matrix[0, 1] # 相关系数值 → 1.0 ``` ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值