文章目录
Logistic 回归
推导
数据说明
- 数据集: { ( x i , y i ) } i = 1 m \{(x_i, y_i)\}_{i=1}^m { (xi,yi)}i=1m( m m m 个样本)
- x i x_i xi 可能是多维(假设有 d d d 维)
- y i ∈ { 0 , 1 } y_i \in \{0,1\} yi∈{ 0,1}
本质
- 用了一个数学性质优的 S i g m o i d Sigmoid Sigmoid 函数: p = 1 1 + e − ( ω T x + b ) p=\frac{1}{1+e^{-(\omega^Tx+b)}} p=1+e−(ωTx+b)1,将线性回归 y = ω T x + b y=\omega^Tx+b y=ωTx+b 与二分类任务 y ∈ { 0 , 1 } y\in\{0,1\} y∈{ 0,1} 联系起来,得到了 p = 1 1 + e − y p=\frac{1}{1+e^{-y}} p=1+e−y1
- 通过梯度下降法得到参数 ω \omega ω 和 b b b,代入要分类的样本 x x x,计算出对应的 y y y 值(相当于该样本的类后验概率 p ( y = 0 ∣ x ) p(y=0|x) p(y=0∣x),之后简称 p 0 p^0 p0,对应的 p 1 = 1 − p 0 p^1=1-p^0 p1=1−p0),并与阈值比较,完成分类
损失函数
对数损失
- 单个样本损失: c ( θ ) = { − l n ( p 0 ) , y = 1 − l n ( p 1 ) , y = 0 c(\theta)=\left\{ \begin{aligned} -ln(p^0), && y=1\\ -ln(p^1), && y=0 \end{aligned} \right. c(θ)={ −ln(p