一 什么是逻辑回归
首先,LR虽然名字里有回归,但它并不是解决回归问题,而是解决分类问题的。
另外,有人会问,为线性回归提供阈值来做分类不可以吗? 不可以,因为阈值是无法准确定义,模型是容易被样本数据拉偏的。 之所以LR是个分类问题,
却被叫做回归,因为它利用了sigmoid函数。 sigmoid 可以将数据(LR中指输出y)压缩到[0, 1]之间,它经过一个重要的点(0, 0.5)。这样,将输出压缩到[0,1]之间,
0.5作为边界值,大于0.5作为一类,小于0.5作为另一类。 对应边界的自变量是0. 而0可以作为一条曲线线上点的值,例如y = a*x + b直线上的点值为0. 所以可以
将一条曲线作为输入作为sigmoid的自变量,这样又利用到了线性回归的知识。 所以逻辑回归可以理解为线性回归和sigmoid的结合。