统计学中常用的数据分析方法汇总

本文详述统计学中的各种数据分析方法,涵盖描述统计、假设检验、信度分析、列联表分析、相关分析、方差分析、回归分析、聚类分析、判别分析、主成分分析、因子分析和时间序列分析等多个方面,旨在帮助读者理解和应用这些统计工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

新增内容日志
20210712
    大数定律和中心极限定理

01 | 描述统计

描述统计是通过数据、可视化图表的形式,对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。

1.集中趋势分析

利用平均数、中数、众数等统计指标来表示数据的集中趋势。
例如被试的平均成绩多少?是正偏分布还是负偏分布?
在这里插入图片描述

2.离中趋势分析

靠全距、四分差、平均差、方差(协方差:用来度量两个随机变量关系的统计量)、标准差等统计指标来研究数据的离中趋势。
比如用两个班级的四分差或百分点来比较,就可以得知哪个班级内的成绩分布更分散

3.相关分析

探讨数据之间是否具有统计学上的关联性。
可以是单方面相关,也可以说互相相关。

4.推论统计

5.大数定律和中心极限定理

①大数定律
概率论历史上第一个极限定理属于伯努利,也被称之为“大数定律”。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。
例如抛硬币,出现正反面的概率不尽相同。但是当抛的次数到大一定数量时,两种结果的概率往往各自趋向于二分之一。同样的,我们要统计一个地区的生育率,当统计样本达到一定数量时,概率基本会稳定在一个区间。


②中心极限定理
当样本量越来越大时,样本均值会趋向于正态分布(钟形曲线)。正态分布有两个量来描述,一个是均值,一个是方差。中心极限定理对样本分布不做要求(离散,连续,非正态分布都可以)。
许多统计要求样本是正态分布的,此时中心极限定理可以承担桥梁的作用,实现数据样本的正态分布,满足统计检验方法的先决条件。
比如要用统计检验的方法,比较一个地区男人跟女人秃头的平均年龄是否有差异,但是当样本量较小的时候,样本是离散分布的。但通过中心极限定理,当样本量达到一个阈值,那么样本就可以实现正态分布。

02 | 常见数值

1.平均值

2.加权平均值

我们常用平均数表示一组数据的‘平均水平’。把在一组数据里,一个数据出现的次数称为权。
学校算期末成绩,期中考试占30%,期末考试占50%,作业占20%,

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值