四分位数

 四分位数( Quartile),即 统计学中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的得分就是四分位数。

 概念

  • 第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
  • 第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
  • 第三四分位数 (Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。

第三四分位数与第一四分位数的差距又称四分位距InterQuartile Range, IQR)。

 运算过程

关于四分位数值的选择尚存争议[1]

主要选择四分位的百分比值(y),及样本总量(n)有以下数学公式可以表示:[2]

L_y = (n)\left(\cfrac{y}{100}\right)
  • 情况1: 如果 L 是一个整数,则取 第 L 和 第 L+1 的平均值
  • 情况2: 如果 L 不是一个整数,则取下一个最近的整数。(比如 L = 1.2,则取 2 )

 例如

图示中 箱形图(有四分位数及四分位距)和 概率密度函数 为描述一个常规总量 N(0,1σ 2)的分布情况

一个算法如下(可以兼用TI-83计算器):

  1. 利用中位数使数据分成两列(不要把中位数放入已分好的数列),
  2. 第一四分位数为第一组数列的中位数;第三四分位数为第二组数列的中位数。

以下例子可以用来参考。

例如 1
数据总量: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36
由小到大排列的结果: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

\begin{cases}Q_1 = 15 \\Q_2 = 40 \\Q_3 = 43\end{cases}

例如 2
数据总量: 7, 15, 36, 39, 40, 41

\begin{cases}Q_1 = 15 \\Q_2 = 37.5 \\Q_3 = 40\end{cases}

例如 3
数据总量: 1, 2, 3, 4

\begin{cases}Q_1 = 1.5 \\Q_2 = 2.5 \\Q_3 = 3.5\end{cases}

 应用

不论Q_1,\ Q_2,\ Q_3变异量数数值为何,均视为一个分界点,以此将总数分成四个相等部份,可以通过比较Q_1,\ Q_3 ,分析其数据变量的趋势。

### SPSS 中四分位数分组的方法 在 SPSS 中,可以通过多种方式实现基于四分位数的分组操作。以下是具体的操作流程以及相关概念解释: #### 一、什么是四分位数四分位数是一种用于描述数据分布特征的位置指标。它将一组从小到大排列的数据划分为四个部分,每部分包含相等数量的数据点。三个分割点分别为第一四分位数 \( Q_1 \)[^1]、第二四分位数(即中位数)\( Q_2 \) 和第三四分位数 \( Q_3 \)。 #### 二、SPSS 实现四分位数分组的具体方法 在 SPSS 中可以利用 **Visual Binning 功能** 或者通过变量计算来完成四分位数分组的任务。 ##### 方法 1:使用 Visual Binning 进行分组 1. 打开 SPSS 数据文件并加载目标变量。 2. 转至菜单栏,依次点击 `Transform` -> `Visual Binning...`。 3. 将需要分组的目标变量拖入右侧窗口中的 “待处理变量” 列表框。 4. 设置分箱规则: - 在左侧工具栏选择 “Equal Percentiles”,表示按百分位划分区间。 - 输入所需的分组数目,默认情况下设置为 4 即可得到四分位数分组[^2]。 5. 完成配置后单击 “Apply” 并保存新创建的分组变量。 ##### 方法 2:手动定义四分位数并通过 IF 条件语句赋值 如果希望更灵活地控制分组逻辑,则可以选择编写语法命令的方式来进行自定义分组: ```spss * 假设原始变量名为 score *. RANK VARIABLES=score (A) /NTILES(4) INTO quartile_group. FREQUENCIES VARIABLES=quartile_group. ``` 上述代码片段实现了以下功能: - 使用 RANK 函数按照升序排列原变量,并将其转换为对应的四分位编号存储于新的变量 `quartile_group` 中; - 随后调用 FREQUENCIES 对生成的新变量进行频率统计以便验证结果准确性。 #### 三、注意事项 当采用以上两种方法之一时需要注意以下几点事项: - 如果存在缺失值的情况,在执行任何运算之前应当先明确如何处理这些异常情况; - 不同版本之间界面布局可能略有差异,请参照实际软件环境调整相应步骤; - 结果解读过程中要清楚认识到四分位差仅适用于定量资料分析而不适合定类资料研究情境下运用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值