用样本估计总体

本文详细介绍了如何使用样本数据来估计总体的数字特征,包括平均数、方差、标准差的计算和性质推广。通过实例解析了样本频率分布直方图的计算方法,并探讨了用样本估计总体的两层含义。此外,还提供了多个相关计算的技巧和经典例题,帮助读者深入理解数据处理的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

本小节中的细小知识点很多,需要认真学习,仔细体会。

一、基础知识梳理

频数分布表,频率分布表

注意公式及其变形应用,\(频率=\cfrac{频数}{样本容量}\)\(频数=频率\times 样本容量\)

频率分布折线图和总体密度曲线

茎叶图

利用茎叶图既可以对数据的平均值和方差做定量计算,也可以根据样本数据的分散与集中程度对数据的平均值和方差做定性分析。

二、相关计算

样本数据的数字特征计算:

比如给定一组样本数据\(2,2,4,4,4\)

则①众数为4;②中位数为4;

③平均数为\(\bar{x}=\cfrac{2+2+4+4+4}{5}=2\times \cfrac{2}{5}+4\times \cfrac{3}{5}\)

数据与其对应的频率乘积,再求和;

④方差为\(s^2=\cfrac{1}{5}[(2-3.2)^2\times 2+(4-3.2)^2\times 3]=(2-3.2)^2\times \cfrac{2}{5}+(4-3.2)^2\times \cfrac{3}{5}\)

数据与平均值的差的平方与频率乘积,再求和;

⑤标准差\(s=\sqrt{(2-3.2)^2\times \cfrac{2}{5}+(4-3.2)^2\times \cfrac{3}{5}}\)

频率分布直方图中的数字特征的计算

当一组数据经过加工整理成频率分布直方图后,数据信息会有所损失,所以计算数据的数字特征有一定的难度。

①众数:直方图中最高矩形的中点横坐标;

②中位数:频率分布直方图频率和(面积和)的一半处所对应的横坐标,即面积等分线所对应的横坐标;

③平均数:每个矩形的分组的中点值乘以每个对应矩形的面积再求和;

④方差:每个矩形的分组的中点值与平均值的差的平方与频率乘积,再求和;

⑤标准差:方差的算术平方根;

用样本估计总体的两层含义

①用样本的频率分布估计总体的频率分布;

②用样本的基本数字特征估计总体的基本数字特征;

频率分布直方图的特点

①直方图中相邻两横坐标之差表示组距,纵轴表示\(\cfrac{频率}{组距}\)\(频率=\cfrac{频率}{组距}\times 组距\)

②频率分布直方图中各小长方形的面积(频率)之和为\(1\),各小长方形高之比也就是频率比。

③频率分布表和频率分布直方图是一组数据频率分别的两种形式,前者准确,后者直观。

平均数的计算技巧

比如计算数据\(515,521,527,531,532,536,543,548,558,559\)的平均数。

\(\bar{x}=500+\cfrac{15+21+27+31+32+36+43+48+58+59}{10}=537\)

\(\bar{x}=540+\cfrac{-25-19-13-9-8-4+3+8+18+19}{10}=540+\cfrac{-30}{10}=537\)

给定频数分布表求平均数

思路一:每个矩形的分组的中点值乘以频数再求和,最后除以样本容量;思路二:转化为频率分布表再计算;

分组 15~25 25~35 35~45 45~55 55~65
频数 \(5\) \(5\) \(25\) \(15\) \(10\)
频率 \(\cfrac{5}{60}\)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值