前言
本小节中的细小知识点很多,需要认真学习,仔细体会。
一、基础知识梳理
频数分布表,频率分布表
注意公式及其变形应用,\(频率=\cfrac{频数}{样本容量}\);\(频数=频率\times 样本容量\);
频率分布折线图和总体密度曲线
茎叶图
利用茎叶图既可以对数据的平均值和方差做定量计算,也可以根据样本数据的分散与集中程度对数据的平均值和方差做定性分析。
二、相关计算
样本数据的数字特征计算:
比如给定一组样本数据\(2,2,4,4,4\);
则①众数为4;②中位数为4;
③平均数为\(\bar{x}=\cfrac{2+2+4+4+4}{5}=2\times \cfrac{2}{5}+4\times \cfrac{3}{5}\);
数据与其对应的频率乘积,再求和;
④方差为\(s^2=\cfrac{1}{5}[(2-3.2)^2\times 2+(4-3.2)^2\times 3]=(2-3.2)^2\times \cfrac{2}{5}+(4-3.2)^2\times \cfrac{3}{5}\);
数据与平均值的差的平方与频率乘积,再求和;
⑤标准差\(s=\sqrt{(2-3.2)^2\times \cfrac{2}{5}+(4-3.2)^2\times \cfrac{3}{5}}\);
频率分布直方图中的数字特征的计算
当一组数据经过加工整理成频率分布直方图后,数据信息会有所损失,所以计算数据的数字特征有一定的难度。
①众数:直方图中最高矩形的中点横坐标;
②中位数:频率分布直方图频率和(面积和)的一半处所对应的横坐标,即面积等分线所对应的横坐标;
③平均数:每个矩形的分组的中点值乘以每个对应矩形的面积再求和;
④方差:每个矩形的分组的中点值与平均值的差的平方与频率乘积,再求和;
⑤标准差:方差的算术平方根;
用样本估计总体的两层含义
①用样本的频率分布估计总体的频率分布;
②用样本的基本数字特征估计总体的基本数字特征;
频率分布直方图的特点
①直方图中相邻两横坐标之差表示组距,纵轴表示\(\cfrac{频率}{组距}\),\(频率=\cfrac{频率}{组距}\times 组距\),
②频率分布直方图中各小长方形的面积(频率)之和为\(1\),各小长方形高之比也就是频率比。
③频率分布表和频率分布直方图是一组数据频率分别的两种形式,前者准确,后者直观。
平均数的计算技巧
比如计算数据\(515,521,527,531,532,536,543,548,558,559\)的平均数。
\(\bar{x}=500+\cfrac{15+21+27+31+32+36+43+48+58+59}{10}=537\);
\(\bar{x}=540+\cfrac{-25-19-13-9-8-4+3+8+18+19}{10}=540+\cfrac{-30}{10}=537\);
给定频数分布表求平均数
思路一:每个矩形的分组的中点值乘以频数再求和,最后除以样本容量;思路二:转化为频率分布表再计算;
分组 | 15~25 | 25~35 | 35~45 | 45~55 | 55~65 |
---|---|---|---|---|---|
频数 | \(5\) | \(5\) | \(25\) | \(15\) | \(10\) |
频率 | \(\cfrac{5}{60}\) |