回归分析实践:逻辑回归与神经网络回归
1. 逻辑回归分析
1.1 数据准备
在进行逻辑回归分析前,对数据的直方图分析发现部分变量存在异常值。为构建逻辑回归模型,首先要将响应变量调整为与 glm() 函数兼容的格式。对于二项式族,响应变量有三种指定方式:
- 作为因子;
- 作为值在 0 到 1 之间的数值向量,解释为成功案例的比例(总案例数由权重给出);
- 作为两列整数矩阵:第一列给出成功的数量,第二列给出失败的数量。
这里选择第二种格式,将变量 Class 中表示良性的 2 替换为 0,恶性的 4 替换为 1,代码如下:
BCData$Class<-replace(BCData$Class,BCData$Class==2,0)
BCData$Class<-replace(BCData$Class,BCData$Class==4,1)
执行上述代码后,查看 Class 变量的分布:
table(BCData$Class)
结果显示:
0 1
444 239
这表明有 444 个良性案例和 239 个恶性案例。同时,由于 Id 变量为观测 ID,对模型无作用,故在模型中省略该变量,构建逻辑回归模型的代码如下:
逻辑回归与神经网络回归对比
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



