一、异常值检验方法概述
在SPSSAU(在线SPSS)中进行线性回归分析时,系统提供了3种专业的异常值诊断指标:
- 杠杆值(Leverage):衡量数据点对回归线的影响程度,值越大表示该点对回归线的影响越大
- Cook距离(Cook):综合衡量数据点对回归系数估计的影响程度
- 学生化残差(Sres):标准化后的残差值,用于识别偏离回归线的异常点
二、异常值判断标准
- 离群点判断:当学生化残差绝对值>2时,可认为该点为离群点
- 强影响点判断:当Cook距离值超过临界值时,可认为该点为强影响点
三、SPSSAU操作步骤
- 进入分析模块
- 登录SPSSAU(网页SPSS)平台
- 依次点击【通用方法】→【线性回归】
- 设置变量
- 将因变量拖拽至"因变量Y"框
- 将自变量拖拽至"自变量X"框
- 异常值诊断设置
- 勾选【异常值诊断】选项
- 如需保存异常点信息,勾选【异常点信息保存】
- 开始分析
- 点击"开始分析"按钮运行分析
四、结果解读与处理建议
- 结果查看
- 分析结果中会输出异常点诊断表格
- 表格中会标注可能的异常点及其三个指标值
- 异常点处理
- 如需过滤异常点,可使用"筛选样本"功能
- 根据诊断标准设置筛选条件(如学生化残差绝对值≤2)
- 使用筛选后的数据进行重新分析
- 结果对比
- 建议对比包含异常点和剔除异常点后的分析结果
- 根据实际情况决定是否保留异常点
五、注意事项
- 异常值诊断应在模型建立后进行
- 不是所有异常点都需要剔除,需结合研究背景判断
- 剔除异常点后应重新检验模型假设条件
- 建议记录异常点处理过程,确保分析过程可追溯
通过SPSSAU提供的这些功能,研究者可以全面评估数据中的异常点,确保线性回归分析结果的稳健性和可靠性。
参考文献:
- The SPSSAU project(2024). SPSSAU.(Version 24.0)[Online Application Software]. Retrieved from https://www.spssau.com.
[2] 周俊,马世澎. SPSSAU科研数据分析方法与应用.第1版[M].电子工业出版社,2024.