1、上午完善了所有单变量的分析,缺失值替换等数据准备和预处理工作
2、下午用weka的logistic算法跑了下,下班的时候又用R跑了下,居然发现系数不一样,R是weka的2倍关系,weka预处理不能直接把numeric的class变量转换成binary,binary变量一转换就是全部转换,应该用numeric转换成nominal,选择last列就可以了
3、但是昨天用的建模方法都是单变量分析,iv排序,然后选入模型拟合得到系数,后来我想研究如何反应变量之间的关系,开始研究SAS中logistic回归的逐步回归、向前回归、向后回归,他是用wald卡方检验,通过检验p值选入,或删除变量,我的问题是不确定这种方法是否考虑了所谓多因素的联合影响?还是只是检验回归方程系数的显著性,这一点还需要研究

本文分享了使用Weka和R进行Logistic回归的经验,包括数据预处理、单变量分析及模型建立的过程,并探讨了不同工具得出的回归系数差异。此外,还讨论了逐步回归、向前回归和向后回归等方法在变量选择中的应用。

被折叠的 条评论
为什么被折叠?



