加权平均值即将各数值乘以相应的
权数,然后加总求和得到总体值,再除以总的单位数。
平均数的大小不仅取决于总体中各单位的标志值(变量值)的大小,而且取决于各标志值出现的次数(
频数),由于各标志值出现的次数对其在平均数中的影响起着权衡轻重的作用,因此叫做权数。
加权平均值
即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的
单位数。
下面是一个同学的某一科的考试成绩:
平时测验 80, 期中 90, 期末 95
学校规定的科目成绩的计算方式是:
平时测验占 20%
期中成绩占 30%
期末成绩占 50%
这里,每个成绩所占的比重叫做权重。那么,
加权平均值 =( 80*20% + 90*30% + 95*50% )/(20%+30%+50%)=90.5
算术平均值(80 + 90 + 95)/3 = 88.3
上面的例子是已知权重的情况。下面的例子是未知权重的情况:
股票A,1000股,价格10;
股票B,2000股,价格15;
算术平均值 = (10 + 15) / 2 = 12.5;
加权平均值 = (10 * 1000 + 15 * 2000) / (1000 + 2000) = 13.33
其实,在每一个数的权数相同的情况下,
加权平均值就等于算术平均值。
加权平均数的意义
权重是一个相对的概念,是针对某一指标而言。某一指标的权重是指该指标在整体评价中的相对重要程度。 权重表示在评价过程中,是被评价对象的不同侧面的重要程度的定量分配,对各评价因子在总体评价中的作用进行区别对待。事实上,没有重点的评价就不算是客观的评价。 打个比方说, 一件事情, 你给它打60分, 你的老板给它打100分, 如果平均, 则是(100+60)/2=80分. 但因为老板说的话分量比你重, 假如老板的权重是2, 你是1, 这时求平均值就是加权平均了, 结果是(100*2 + 60*1)/(1+2)=86.67分, 显然向你的老板那里倾斜了。假如老板权重是3,你的权重是1,结果是(100*3+60*1)/(1+3)=90分。这就是根据权重的不同进行的平均数的计算,所以又叫加权平均数。
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------
方差(variance)是在概率论和统计方差衡量
随机变量或一组数据时离散程度的度量。概率论中方差用来度量
随机变量和其
数学期望(即
均值)之间的偏离程度。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的
平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。
方差是衡量源数据和期望值相差的度量值。
方差刻画了随机变量的取值对于其数学期望的
离散程度。(标准差、方差越大,离散程度越大。否则,反之)
若X的取值比较集中,则方差D(X)较小,若X的取值比较分散,则方差D(X)较大。
因此,D(X)是刻画X取值分散程度的一个量,它是衡量取值分散程度的一个尺度。
而当用
作为样本X的方差的估计时,发现其数学期望并不是X的方差,而是X方差的
倍,
的数学期望才是X的方差,用它作为X的方差的估计具有“
无偏性”,所以我们总是用
来估计X的方差,并且把它叫做“
样本方差”。




方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差,记作S2。 在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。
公式可以进一步推导为:
。其中x为这组数据中的数据,n为大于0的整数。

当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。
[4]

方差与样本方差的区别:
如是总体,标准差公式根号内除以n
如是样本,标准差公式根号内除以(n-1)
(样本至少比总体的个数少一)
因为我们大量接触的是样本,所以普遍使用根号内除以(n-1)
标准差公式
1、方差s^2=[(x1-x)^2+(x2-x)^2+.(xn-x)^2]/(n)
2、标准差=方差的算术平方根
公式意义 :所有数减去其平均值的平方和,所得结果除以该组数之个数(或个数减一,即变异数),再把所得值开根号,所得之数就是这组数据的标准差.