数据的图表表示
既然是统计学,肯定是和数据的统计有关,这也就当然离不开数据的展示,直观的数据展示可以让我们发现数据的规律和隐藏的价值。
1) 直观文字展示,直接用文字表述某数据的的情况
2)表格表示,直接罗列数据到表格中
3)图形表示,将数据通过各式图形表现出来
1、数据的预处理
原始数据可能不能直接使用,需要我们进一步的处理后才能进行统计分析。
审核--》筛选--》排序--》
数据透视表:对数据的重要信息进行汇总和作图,形成交叉表(列联表),必须有列标题
2、品质的数据整理与展示
预处理后。需进一步分类或分组,面对什么样的数据类型,然后根据相应的类型做不同的处理。
2.1分类数据的整理与展示
计算一类数据的频数、频率、比例、等,形成分布图,
2.2 数据的展示
1)条形图,趋势明显,一个变量和另外一个变量的变化关系,
2)帕累托图,按数据的频数排序绘制的条形图,易看书哪类数据出现的多,哪类少,
3)饼图,一个总体各组成部分占比,使用结构性问题
3、数值型数据的整理展示
单值变量分组,组距变量分组 比如80--90分的分布频数等,上组线不在内,即变量x满足:a<=x<b.
1)分组展示:直方图 ,数据的分布直观、形象
注意和条行图区别,
2)未分组数据,茎叶图和箱线图
茎叶图,反应原始数据分布的图形,数据分布状况和离散状况,是否对称?集中?离群点?
箱线图,根据最大值 最小值 中位数 两个四分位数五个特征绘制
3)时间序列数据:线图
现象随时间变化的特征
4)多变量的数据图示
散点图 :2变量
气泡图:3变量
雷达图:>3个变量
小结