应用统计学知识整理

本文详细介绍了统计学中的基本概念,包括分类变量、总体与样本、参数与统计量的区分,以及数据的分类。此外,文章还深入探讨了不同类型的抽样方法,如简单随机抽样、分层抽样和整群抽样,并阐述了随机误差的概念。通过对这些基础知识的梳理,读者可以更好地理解和应用统计学方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第一章

分类变量

统计学中的变量(variables)大致可以分为数值变量(numrical)和分类变量(categorical)。
有序分类变量和无需分类变量的区别是:前者对于“比较”操作是有意义的,而后者对于“比较”操作是没有意义的。

总体、样本、参数、统计量

总体(Population):所研究的全部个体(数据)的集合,其中每一个个体也称为元素。
样本(Sample):从总体中抽取一部分元素的集合(例如,从社群中抽10名小伙伴,这10名就可以成为样本)
样本容量(Sample size):样本中所含个体的数量
参数:研究者想要了解的总体的某种特征值。所关心的参数主要有总体均值、总体标准差、总体比例等。研究总体目的
统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。
需要注意的重点是:【统计量对应样本】【参数对应总体】

数据的分类

按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

分类数据:只能归于某一类别的非数字型数据。例如:人口性别

顺序数据:只能归于某一有序类别的非数字型数据,例如:将产品分成不同的等级。

数值型数据:按数字尺度测量的观测值,

按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据

观测数据:通过调查或观测而收集到的数据,是在没有对事物人为控制的条件下而得到的。

实验数据:在实验中控制实验对象而收集到的数据。

按照被描述的对象与时间的关系,可以将统计数据分为截面数据和时间序列数据

截面数据:在相同或近似相同的时间点上收集的数据。描述的是现象某一时刻的变化情况

时间序列数据:在不同时间上收集到的数据。描述的是现象随时间而变化的情况

第二章

抽样类型

在这里插入图片描述

简单随机抽样

对总体不做任何处理,直接按照随机原则抽取调查单位。

分层随机抽样(类型抽样)

将总体按照某一主要标志进行分类(分组),在各类别中抽取一部分调查单位共同组成样本。(组内的个体差异较小时而各层的差异比较大)

</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值