逻辑回归是解决分类问题。样本的输入X是标量矩阵,而输出y是标记,只有固定几个值。
举个例子,给你一系列参数,病人的年龄,身高,体重,肿瘤数量,肿瘤大小,一些血液参数等,判断病人得的是恶心肿瘤(1)还是良性肿瘤(0)。
从标量寻找一个模型映射到标记变量是困难的。于是转变思路,把这个病人是否得恶性肿瘤转为这个病人有多少概率得恶性肿瘤,这个概率在0-1之间,是一个连续的变量,我们可以规定概率超过某个阀值就诊断病人得的是恶性肿瘤。
那么我们的问题就是从X→p(y)(0≤p(y)≤1)X\rightarrow p(y)(0\le p(y) \le1)X→p(y)(0≤p(y)≤1)
求X中不同特征值对y的影响,我们很容易想到线性组合:XβX\betaXβ
这样我们需要求的一个函数就是 Xβ→p(y) (−∞,∞)→(0,1)X\beta\rightarrow p(y) \ \ \ (-\infin,\infin)\rightarrow(0,1)Xβ→p(y) (−∞,∞)→(0,1)
sigmoid 函数正好是这样的一个函数,它的图像如图:
sigmoid(x)=11+e−xsigmoid(x)=\frac{1}{1+e^{-x}}sigmoid(x)=1+e−x1
将上式中的x替换为XβX\betaXβ 得到:hβ(X)=11+e−Xβh_\beta(X)=\frac{1}{1+e^{-X\beta}}hβ(X)=1+e−Xβ1
这个就是我们逻辑回归的模型啦。
下面定义代价函数:
hβ(X)h_\beta(X)hβ(X)是一个值域为(0,1)的函数,我们希望当
hβ(X)=1,y=1h_\beta(X)=1,y=1