作者:禅与计算机程序设计艺术 1.简介 在机器学习中,我们会用到多种统计方法。其中,协方差(covariance)和相关系数(correlation coefficient)是最常用的两个统计量。它们都属于线性代数中的概念。虽然名字不一样,但是二者其实都是用来衡量变量之间的关系。假设我们有两个变量X和Y,假设样本容量n,且已知各自独立同分布。那么,协方差公式可以表示为: 1 n ∑ i = 1 n (