第一章 绪论
1.1 统计及其应用领域
一、什么是统计学
二、统计学的研究对象
1.2 统计数据的类型
一、按计量尺度分
二、按收集方法分
- 观测数据:通过调查或观测收集到的数据
- 实验数据:在实验中收集到的数据
三、按时间状况分
- 截面数据:某一时刻的变化情况;
- 时间序列:描述现象随时间变化情况
1.2 统计中的几个基本概念
- 总体:包含所研究的全部个体(或数据)的集合;
- 样本:从总体中抽取的一部分元素的集合;
- 样本量:构成样本的元素的数目;
- 参数:描述总体特征的概括性数字度量;
- 统计量:根据样本数据计算出来的一个量;
- 变量:说明现象某种特征的概念,分为 分类变量(有序/无序) 和 数值变量。
第二章 数据的搜集
2.1 数据的来源
一、数据的直接来源
1.直接来源
自己调查或实验得来的一手数据
2.间接来源
1.数据是别人的,自己找到并加以使用
2.特点:
-搜集方便,采集成本低;
-作用广泛;
-搜集二手资料是研究者首先考虑并采用的
3.缺陷:针对性差
4.对二手数据进行评估:
-数据是谁搜集的——可信度评估;
-为什么目的搜集的;
-数据是怎样搜集的;
-什么时候搜集的——及时性。
2.2 调查方法
一、概率抽样与非概率抽样
1.概率抽样(随机抽样)
遵循随机原则,每个单位被抽中的概率已知且都可以计算出来
1.简单随机抽样:
从包含N个(有限个)单位的抽样框中,随机地、一个个(不是一次性)地抽取;
优点:
- 简单;
- 用样本统计量对目标量进行估计比较方便
缺点:
- 当N很大时,不易构造抽样框;
- 抽出的单位很分散,给实施调查增加了困难;
- 没有其他辅助信息提高估计的效率
2.分层抽样:
按某种特征划分为不同(差异要大)的层,再从不同层中独立、随机的抽取样本;
优点:
- 保证样本的结构和总体的结构相近,提高估计精度;
- 组织实施调查方便;
- 既可以对总体参数进行估计,也可以对各层的目标量进行估计
3.整群抽样:
将总体中若干个单位合并为组(群),抽样时直接抽取群,调查抽中群中所有单位;
优点:
- 只需考虑群的取样框,简化工作量;
- 掉擦汗的地点相对集中,节省费用,方便调查的实施;
缺点:
- 估计的精度较差
4.系统抽样:
将总体中所有单位按一定顺序排序,再规定范围内随机抽一个其实单位,再按事先制定好的规则确定其他样本;
优点:操作简便,可提高估计精度;
缺点:对估计量方差的估计比较困难
5.多阶段抽样:
首先抽取群,再从抽中的群中抽若干个单位调查。
2.非概率抽样
1.方便抽样
依据方便的原则,再公共场合路人进行拦截调查
优点:容易实施,调查的成本低;
缺点:样本单位的确定有随机性,无法代表有名确定义的总体,调查结果不宜推断总体
2.判断抽样
根据经验、判断、和对研究对象的了解,有目的的选择样本。
分类:
- 重点调查:选择一部分重点(再总体中地位重要)单位,如选择产量最高的工厂调查;
- 典型调查:着有代表性的单位,如研究犯罪时选择典型的犯人;
- 区别:终点调查的标志值在总体中占有很大的比例,典型调查的标志值不一定占很大比例。
3.资源样本
被调查者资源报名参加
4.滚雪球抽样
选择一组调查单位并调查后,再请它们提供另外一些研究总题的调查对象
优点:容易找到属于特定群体的被调查者,调查的成本低
5.配额抽样
先将总体所有单位按一定标志(变量)分成若干类,再每个类用方便抽样或判断抽样。
3.概率抽样与非概率抽样的比较
二、收集数据的方法
1.自填式问卷
2.面访式问卷调查
3.电话式问卷调查
4.各调查方式的比较
2.3 实验方式
2.4 数据的误差
一、抽样误差
二、非抽样误差
三、误差的控制
第三章 描述数据的图标方式
3.1 数据描述的意义和分类
3.2 定量数据的图形描述
3.3 定性数据的图形描述
第四章 数据的概括性度量
4.1 集中趋势
一、加权平均数
二、几何平均数
三、调和平均数
四、四分位数
- 如果位置是整数,那么就是这个数
- 如果是X.5,那么就是第X/2+(第X+1)/2
- 如果是X.25或X.75,那么就是第X+(第X+1 - 第X)*0.25/0.75