简单逻辑回归模型可以先参考这篇文章学习下
https://blog.youkuaiyun.com/weixin_41744624/article/details/105506951
数据预览
我们使用的是R自带包mtcars中的数据来举例,其中响应变量(y)是数据集中的"am"
异常值检验
首先来检查一下数据集的异常值(缺失、离群、重复),需要根据数据的具体情况确认是否去除,本例中不考虑重复值
离群值
可以选择箱线图,mvoutlier包中的sing2等函数
在此我们选择箱线图演示,绘制数据集中预测变量(x)与am的关系,查看有无离群值:
boxplot(mtcars$mpg~am,mtcars)
缺失值
rowSums(is.na(raw_data))
缺失值处理可以采取如下分割数据集策略,本例中没有缺失值:
>d_n <- raw_data[which(rowSums(