集中趋势
集中趋势是用来描述数据集中的位置。常用的集中趋势参数有:
- 均值:所有数据值的算术平均值。
- 中位数:将数据集按大小排序后,位于中间位置的数值。
- 众数:数据集中出现次数最多的数值。
离散趋势
离散趋势用来描述数据的分散程度。常用的离散趋势参数有:
- 全距:数据集中最大值与最小值之差。
- 四分位距:上四分位数与下四分位数之差。
- 方差:各数据值与均值之差的平方的平均值。
- 标准差:方差的平方根。
分布形态描述
分布形态描述数据的分布特征。常见的分布形态有:
- 对称分布:数据在中心位置左右对称。
- 正偏态分布:数据向左偏离,右侧尾部较长。
- 负偏态分布:数据向右偏离,左侧尾部较长。
二项分布与正态分布
- 二项分布:离散型概率分布,描述在n次独立的伯努利试验中成功次数的概率分布。
- 正态分布:连续型概率分布,具有对称的钟形曲线,由均值和标准差决定。
抽样分布
抽样分布是样本统计量的概率分布。常见的抽样分布有:
- 样本均值的抽样分布:当样本容量足够大时,样本均值的抽样分布近似正态分布。
- t分布:当总体标准差未知时,用于估计总体均值的抽样分布。
参数估计
参数估计是根据样本数据对总体参数进行估计。分为点估计和区间估计。
点估计
点估计是用样本统计量来估计总体参数的值。例如,用样本均值估计总体均值。
区间
区间估计是用一个区间来估计总体参数的值。例如,用置信区间估计总体均值。
假设检验
假设检验是用样本数据来检验关于总体参数的假设。常见的步骤包括:
- 提出原假设(H0)和备选假设(H1)。
- 选择检验统计量和显著性水平(α)。
- 计算检验统计量的值和对应的P值。
- 根据P值与α的关系,做出推断结论。
例如,检验某种药物对病人体重的影响,可以设定原假设为药物无影响(H0:μ=0),备选假设为药物有影响(H1:μ≠0)。通过计算检验统计量和P值,可以判断药物对病人体重的影响是否具有统计学意义。