逻辑回归用于处理分类问题,其输出结果是离散的。
如何工作?
逻辑回归使用基础逻辑函数通过估算概率来预测因变量的标签与自变量的关系。
这些概率值必须转换为二进制,以便实际中进行预测。因此,需要使用逻辑函数sigmoid函数。然后使用阈值分类器将(0,1)范围的值转化成0和1的值来表示结果。
sigmoid函数
S形曲线,将任意值映射为(0,1)范围内的值。
逻辑回归VS线性回归
- 不同点:
逻辑回归处理的是分类问题,线性回归处理的是回归问题,这是两者最本质的区别。
逻辑回归的因变量是离散的,线性回归的因变量是连续的,这是两者最大的区别。 - 相同点:
两者都使用了极大似然估计来对训练样本进行建模。其中,线性回归使用最小二乘法实际上就是自变量与超参数确定的,因变量服从正态分布的假设下,使用极大似然估计的一个化简。
二者在求解超参数的过程中都使用了梯度下降的方法。
python 实现
数据说明:该数据集包含了社交网络中用户的信息。这些信息涉及用户ID,性别,年龄以及预估薪资。一家汽车公司刚刚推出了他们新型的豪华SUV,我们尝试预测哪些用户会购买这种全新SUV,并且在最后一列用来表示用户是否购买。我们将建立一种模型来预测用户是否购买这种SUV,该模型基于两个变量,分别是年龄和预计薪资。因此我们的特征矩阵将是这两列。我们尝试寻找用户年龄与预估薪资之间的某种相关性,以及他是否购买SUV的决定。
数据从这里获取
Step 1 数据预处理
import