【AI概念】协方差(covariance)与相关系数(correlation)是什麽?有什么区别?在机器学习中担任什么角色?|协方差矩阵、马氏距离、归一化|主成分分析PCA、代码实现与可视化、实际应用

大家好,我是爱酱。本篇將會系统讲解协方差(covariance,又称共变异数)与相关系数(correlation coefficient,或简称correlation)的定义、公式、几何意义、实际案例和应用场景。内容适合初学者和进阶读者,分步解释,配合公式和可视化示例。

注:本文章含大量数学算式、详细例子说明及大量代码演示,大量干货,建议先收藏再慢慢观看理解。新频道发展不易,你们的每个赞、收藏跟转发都是我继续分享的动力!


一、协方差(Covariance)与相关系数(Correlation)简单介紹

名称定义

  • 协方差:同時亦被称為“共变异数”,英文为covariance,常用符号为$\mathrm{cov}(X, Y)$$\sigma(X, Y)$

  • 相关系数:常被称为“相关系数”,英文为correlation coefficient,简称 correlation,常用符号为$r$$\rho$

协方差与相关系数在机器学习中的作用

要学习这两概念,最好先了解他们在机器学习中担任什么样的角色,有什么用途。

  1. 特征关系分析与特征选择
    • 协方差和相关系数用于衡量特征之间的线性关系

    • 在特征选择阶段,相关系数常用于筛除高度相关(冗余)的特征减少多重共线性,提高模型泛化能力。例如,若两个特征相关系数$r > 0.9$,通常只保留一个。

  2. 降维与特征提取
  3. 异常检测与数据探索
    • 通过分析协方差和相关系数,可以发现异常点或异常关系,辅助异常检测、数据清洗等。

    • 例如,利用协方差矩阵计算马氏距离(Mahalanobis Distance),可检测多变量异常点。

  4. 回归与建模
    • 在线性回归中,协方差用于衡量自变量与因变量的线性关系强度,相

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值