相关系数
相关系数是衡量两个变量之间相关性大小的量。最常用的相关系数有两种,皮尔逊相关系数和斯皮尔曼相关系数,在选取用何种相关系数时,需要根据不同的条件进行计算和分析,否则容易建模出错。
总体和样本
总体是指所要考虑对象的全部个体。我们通常需要求总体数据的均值方差标准差等特征。
样本是从总体中抽取的一部分个体,叫做总体的一个样本。
多数情况下,我们无法直接求总体的特征值,需要通过计算抽取的样本的统计量来估计总体的统计量:
例如使用样本均值、样本标准差来估计总体的均值和总体的标准差。

皮尔逊相关系数
协方差在一定条件下可以表示变量X、Y的相关性,但与两个变量的量纲有关,不适合做比较。
因此要想用协方差来做比较,就必须消去量纲的影响,而要消去量纲,只需将两个变量标准化,这样就得到了皮尔逊相关系数
皮尔逊相关系数就将变量X和Y标准化后的协方差。
总体皮尔逊相关系数计算公式


本文深入探讨了相关系数的概念,包括皮尔逊和斯皮尔曼相关系数的定义与应用,强调了在不同条件下选择合适相关系数的重要性。同时,文章详细解释了总体与样本的概念,以及如何通过样本统计量来估计总体特征。
最低0.47元/天 解锁文章
3万+

被折叠的 条评论
为什么被折叠?



