常用的基础统计量和图形

本文介绍了定量变量与定性变量的概念,以及如何用统计量概括数据。位置统计量如均值、中位数、四分位数和众数被讨论,尺度统计量如极差和标准差展示了数据的集中与分散。同时,文章探讨了直方图、盒形图、茎叶图和散点图等定量变量的图表表示,以及饼图和条形图用于定性变量的可视化方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

定量变量:变量按照随机规律所取的值是数量时,该变量称为定量变量,或数量变量、随机变量。

定性变量:像性别或观点之类的取值非数量值的变量就称为定性变量,或分类变量、属性变量。

当然,定性变量也可以用定量变量来描述,比如男生的人数、比例等,定性变量只有用数量描述时,才能建立数学模型,使用计算机来分析。


用数字概括数据

      生活中人们常常会用几个数字概括大量数字,比如杭州人的平均收入是多少,北京和上海两地区的收入差距是多少,中国男性的平均身高是多少等等。这些“平均”,“差距”就是用来概括汇总的数字。

常用概括统计量(汇总统计量)如下:

1、位置统计量(和“位置”有关的统计量)

(1)算术平均值/均值/样本均值       特点:容易被极端值影响

(2)(样本)中位数:数据按照从小到大排序后位于中间的那个数(样本量为奇数),或中间两个数的平均值(样本量为偶数)。 特点:不易被极端值影响,比均值稳健

(3)上下四分位数:数据从小到大排序后,位于数据上下四分之一的地方,上四分位数又称为75百分位数,下四分位数又称为25百分位数。

(4)众数:一组数据中出现次数最多的数值。有时候在一组数据中有好几个众数。

2、尺度统计量(描述数据集中于分散程度的度量)

(1)极差:极大值和极小值之间的差

(2)标准差:度量样本中各个数值到均值的距离的一种均值。它是方差的平方根。

用图表表示数据

1、定量变量的表示

(1)直方图:定量变量最常用的图表之一,作法:把横轴分成若干等宽的区间,然后计算数据在各个区间上的频数,并在各个区间上画出高度与相应频数成比例的矩形条。当然,纵坐标比一定是数量,还可以是比例,就看用的是频数还是频率了。

(2)盒形图:又称箱线图、盒子图、箱图,每个盒子中间的粗横线是中位数,封闭盒子的上下两条横线为上下四分位数,因此有一半的数目在盒子内部。在盒子外部上下各有一条纵线,表明盒子外的数据分布,在纵线的两个端点各有一条短横线,表示最大值和最小值。

(3)茎叶图:该图既能展示数据的分布,又能保留原始数据。

(4)散点图:描述数量变量之间的关系,对两个变量来说,每一个点代表一个观测值,点的横纵坐标分别表示其相应两个变量的取值。

2、定性变量的表示

(1)饼图:一个由许多扇形组成的圆,各个扇形的大小比例等于变量各个水平(类别)的频数或比例。

(2)条形图:条形图可以看出各个类别变量的数目。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值