Logistic回归:
1.1 Logistic回归简介
Logistic回归用于分类,样本是两类的情况,也就是一类用0表示,一类用1表示,常说的0-1分类情况。样本用表示,
是样本集合,
表示第
个样本,
是一个
维的向量,可以是行向量,也可以是列向量,一般情况下向量都代表列向量(大部分的人都喜欢这么用),所以本文所说的向量都是代表列向量。
表示每一个样本的维度都是
。
在0-1分类问题中,如果不从概率的角度考虑问题,那就是要么某个样本属于第一类,要么就不属于第一类,这是一个确定性的问题。但是从概率的角度看待这个问题,应该认为某个样本可能属于第一类,并且属于第一类的概率用表示,那么不属于第一类的概率就是
,如果
,那就表示这个样本属于第一类,反之不属于第一类。
经过科学家不懈的努力,终于找到了一个适合这样的函数,可以将任何数据映射到0,1之间。而概率也恰恰是0,1之间的数,那也就表明要被分类的样本可以映射到0,1之间,这个映射得到的结果值就是属于第一类的概率。采用的sigmoid函数,它的表达式如下:
(1)
它的图像如下:
它是一个属于0,1之间的一个函数值,当趋向于负无穷的时候等于0,当
趋向于正无穷的时候等于1。采用这种形式,第
个样本属于第一类的概率可以用如下的式子表达:
&nbs