作者:禅与计算机程序设计艺术
1.简介
在机器学习中,我们会用到多种统计方法。其中,协方差(covariance)和相关系数(correlation coefficient)是最常用的两个统计量。它们都属于线性代数中的概念。虽然名字不一样,但是二者其实都是用来衡量变量之间的关系。假设我们有两个变量X和Y,假设样本容量n,且已知各自独立同分布。那么,协方差公式可以表示为:
1n∑i=1n(xi−x‾)(yi−y‾),\frac{1}{n} \sum_{i=1}^n (x_i - \overline x)(y_i - \overline y),