多元数据的统计分析与误差传播
1. 协方差
1.1 相关性的定义
联合概率密度函数 ( p(d_1, d_2) ) 不仅可以描述 ( d_1 ) 和 ( d_2 ) 各自的行为,还能描述它们之间的相关程度。存在以下三种情况:
- 正相关 :当 ( d_1 ) 的异常高值与 ( d_2 ) 的异常高值同时出现,且 ( d_1 ) 的异常低值与 ( d_2 ) 的异常低值同时出现时,称 ( d_1 ) 和 ( d_2 ) 正相关。
- 负相关 :当 ( d_1 ) 的高值与 ( d_2 ) 的异常低值同时出现,且 ( d_1 ) 的异常低值与 ( d_2 ) 的高值同时出现时,称 ( d_1 ) 和 ( d_2 ) 负相关。
- 不相关 :若既不存在正相关也不存在负相关,则称 ( d_1 ) 和 ( d_2 ) 不相关。
1.2 协方差的计算
将 ( (d_1, d_2) ) 平面以均值 ( \bar{d} 1, \bar{d}_2 ) 为中心划分为四个象限,通过将 ( p(d_1, d_2) ) 乘以一个具有四象限交替符号模式的函数 ( s(d_1, d_2) ) 并积分,可量化相关性。当 ( s(d_1, d_2) = (d_1 - \bar{d}_1)(d_2 - \bar{d}_2) ) 时,得到的结果称为协方差 ( \sigma {1,2} ),计算公式如下:
[ \sigma_{1,2} = \iint (d_1 - \bar{d}_1)(d_2 - \bar{d}_2)
超级会员免费看
订阅专栏 解锁全文
2536

被折叠的 条评论
为什么被折叠?



