我眼中的回归变量筛选
变量筛选是回归建模过程关键的一步,由于变量间的相关性,必然会导致不同的筛选方法得到不同的模型。
在所有变量筛选方法中,向前法、向后法以及逐步回归法的使用频率较高,因为这类方法操作简单、运算速度快,非常实用,这种方法选出的变量 在入模后模型比较接近最优。
然而经向前法、向后法与逐步回归法筛选出的变量构建的模型并不是最优模型,若想构建最优模型,可以通过构建每个X的组合去获取最优变量组合,即全子集法。但全子集法因运算速度等限制,会有使用上的
本文探讨了回归建模中的变量筛选方法,包括向前法、向后法、逐步回归法、全子集法和Lasso算法。作者强调了Lasso在处理稀疏系数回归中的应用,并分享了在实际工作中采用的变量筛选流程。此外,还介绍了回归模型的预测功能,包括点估计和区间估计,以及预测时应注意的自变量取值范围问题。
我眼中的回归变量筛选
变量筛选是回归建模过程关键的一步,由于变量间的相关性,必然会导致不同的筛选方法得到不同的模型。
在所有变量筛选方法中,向前法、向后法以及逐步回归法的使用频率较高,因为这类方法操作简单、运算速度快,非常实用,这种方法选出的变量 在入模后模型比较接近最优。
然而经向前法、向后法与逐步回归法筛选出的变量构建的模型并不是最优模型,若想构建最优模型,可以通过构建每个X的组合去获取最优变量组合,即全子集法。但全子集法因运算速度等限制,会有使用上的
1万+
6641

被折叠的 条评论
为什么被折叠?