均值:描述的是样本集合的中间点
标准差:描述的是样本集合的各个样本点到均值的距离的平均值
类似“散布度”之所以除以n-1而不是n,是因为这样能使我们较小的样本集更好的逼近总体的标准差,即“无偏估计”
方差:标准差的平方
标准差和方差一般用来描述一维数据
协方差定义:
如果结果为正,说明两者正相关。若为负,则是正相关。
协方差只能处理二维问题,维数多了,就要计算多个协方差。
故用协方差矩阵来表示。
一个简单的三维的例子。假设数据集有三个维度,则协方差矩阵为
可见,协方差矩阵是一个对称的矩阵,而且对角线是各个维度上的方差。
转自:http://blog.youkuaiyun.com/beechina/article/details/51074750
作者:HenryXFHuang