logistic regression可以解决分类问题,即输出的结果只有0和1两种,比如,对于邮件的判断只有是或者否。这种分类问题使用传统的线性回归并不能很好的解决。
一个小例子
例如,当我们根据肿瘤的大小判断一个肿瘤是不是良性的时候,输出结果只有是或者否,用1和0表示,给定的样本点,并且我们使用传统的线性回归问题解决拟合的函数图像如下:
图像中我们可以根据拟合曲线,当输出值大于0.5(根据图像判断的值)的时候,确定输出的为恶性(即为1);当输出值小于0.5(根据图像判断的值)的时候,确定输出的为良性(即为0)。但是,当我们有新的样本点加入的时候,如下图:
我们会发现,对于新的拟合曲线使用上面的方法和标准(0.5)并不能很好的做出预测。因此我们需要新的回归形式,即下面要说的logistic回归。
sigmoid function(logistic function)
sigmoid函数,又称为逻辑函数。是一个单调上升的函数,函数的形式如下:
1/(1 + EXP(-A*(X-C)))
其中A和C为参数,A控制着函数的陡峭程度,C控制着函数的对称点的水平坐标位置,下面用三个函数图像说明:
图像1,A=1,C=0: