回归分析实验报告
实 验报 告
实验名称: 数据整理与分析
相关分析实验报告
实验课程: 统计学
数据的整理与分析
一、 实验目的:
学会运用Excel中次数分布表、透视表、统计图以及描述性统计功能来分析一组有调查意义的数据;从而通过分析得出有意义的结论以及推测预计。
二、实验原理 :
次数分布表的制作过程,第一步找出最大、最小值,确定全距R;第二步利用斯透奇斯规则确定组数m,再根据组数与组距的关系确定组距;第三步分组,根据分组标志和分组上限确定在组内数据的频数以及频率。数据透视表,选中当前数据库表中人一个单元格,单击菜单中的“数据”—“数据透视表与数据透视图”。直方图是在平面坐标上一横轴根据各组组距的宽度标明各组组距,一纵轴根据次数的高度表示各组次数绘制成的统计图。折线图是在直方图的基础上,用折线连接各个直方形顶边中点并在直方图形两侧各延伸一组,使者限于横线相连。
三、实验环境:
实验地点:实训楼计算机实验中心五楼实验室3
试验时间:第五周周二
实验软件:Microsoft Excel 2003
四、 实验内容
1、(1)在数据源中选取所需数据,对数据进行分析。利用Excel 对数据进行描述性统计分析。实验内容包括:数据分组、直方图、描述性分析、透视表、实验结果分析。
(2)数据资料:
数据来源“9-33 各地区农村居民家庭平均每人主要食品消费量 (2008年)”如下图所示。
2、 实验步骤
第一步:在数据库中把所要研究的数据对象复制黏贴到新建的Excel工作表sheet1中。我要研究的是“各地区农村居民家庭平均每人主要食品消费量 (2008年)”挑选了其中的蔬菜。
第二步:对sheet2中的数据进行分组。
找出这31个数据中的最大、最小值,得到全距R
其次利用斯透奇斯规则确定组数m,再根据组数与组距的关系确定组距i;
然后分组,根据分组标志和分组上限确定在组内数据的频数以及频率
最后得到全国各地区蔬菜消费量的次数分布表。
第三步:数据分析
在Excel表工具栏中点开“加载宏”—“分析工具库”确认(如图);
再次打开工具栏“数据分析”—“描述统计”确定,得到对该组数据的描述性统计数据。
以下截图为部分实验步骤:
图1.1
图1.2
图1.3
图1.4
图1.5
图1.6
图1.7
图1.8
图1.9
图1.10
图1.11
图1.12
图1.13
图1.14
图1.15
图1.16
五、 实验结果 :
这次的实验是运用Excel的统计分析功能,进行数据的搜集整理和显示.并进行统计数据的录入、分组、汇总及各种常用统计图表的绘制,让我对数据的整理有了更深层次的理解,从而在有限经验样本的基础上实现对总体或现实世界的认识。
先讲述下本次的实验过程。首先是对斯透奇斯公式的计算,m=1+3.322lgN,从以上实验数据中可以得出,N=31,代入公式后得出m=5.95.约等于6.所以组数为6组;组限R=Max-Min=Max(B3:B33)=Min(B3:B33)=162.79-20.57=142.22;组距i=R/m=142.22/6=23.7,所以得出i=25. 其次根据算出来的分组标志进行分组。分成(20~45),(45~70),(70~95),(95~120),(120~145),(145~170)共六个组。根据“上组限不计入的原则”,在下方将每组的最大值一次排列为“44,69,94,119,144,169”.之后依次计算出“各组频数,各组频率,向上累计次数,向上累计频率,向下累计次数,向下累计频率”。
接下来是FREQUENCY函数的应用。它的用途是以一列垂直数组返回某个区域中数据的频率分布。所以先选中D20:D25区域,然后在菜单栏上面点击“插入”,选择“插入函数”,将或选择类别改成“统计”,选择函数“FREQUENCY”,然后点击确定。在Data array中填入B:B,在Bins array中填入E13:E18。则各组数据则显示出来,将每一列的数据加起来,看看是否与题目总提供的个数相同,确实为31.以此类推,将各组频率,向上累计次数,向上累计频率,向下累计次数,向下累计频率均填写完整。 再次,点击“工具-加载宏-勾选分析数据库-确定”,然后,点击“工具-数据分析”,然后在数据分析中选择“描述统计”,点确定。将31个原始数据,输入到工作表中的B3:B33。然后步骤如下:第1步:选