统计学学习入门-第一周

本文探讨了数据展示的各种方式,包括文字、表格和图形表示,重点介绍了数据预处理的重要性,品质数据和数值型数据的整理与展示方法,如条形图、帕累托图、饼图、直方图、茎叶图、箱线图、线图、散点图、气泡图和雷达图,旨在帮助读者更好地理解和应用数据可视化技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 数据的图表表示

既然是统计学,肯定是和数据的统计有关,这也就当然离不开数据的展示,直观的数据展示可以让我们发现数据的规律和隐藏的价值。

1) 直观文字展示,直接用文字表述某数据的的情况

2)表格表示,直接罗列数据到表格中

3)图形表示,将数据通过各式图形表现出来

1、数据的预处理

原始数据可能不能直接使用,需要我们进一步的处理后才能进行统计分析。

审核--》筛选--》排序--》

数据透视表:对数据的重要信息进行汇总和作图,形成交叉表(列联表),必须有列标题

2、品质的数据整理与展示

预处理后。需进一步分类或分组,面对什么样的数据类型,然后根据相应的类型做不同的处理。

2.1分类数据的整理与展示

计算一类数据的频数、频率、比例、等,形成分布图,

2.2 数据的展示

1)条形图,趋势明显,一个变量和另外一个变量的变化关系,

2)帕累托图,按数据的频数排序绘制的条形图,易看书哪类数据出现的多,哪类少,

3)饼图,一个总体各组成部分占比,使用结构性问题

3、数值型数据的整理展示

单值变量分组,组距变量分组  比如80--90分的分布频数等,上组线不在内,即变量x满足:a<=x<b.

1)分组展示:直方图 ,数据的分布直观、形象

注意和条行图区别,

2)未分组数据,茎叶图和箱线图

茎叶图,反应原始数据分布的图形,数据分布状况和离散状况,是否对称?集中?离群点?

箱线图,根据最大值 最小值 中位数 两个四分位数五个特征绘制

3)时间序列数据:线图

现象随时间变化的特征

4)多变量的数据图示

散点图 :2变量

气泡图:3变量

雷达图:>3个变量

小结

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值