定义
假设特征与分类结果存在线性关系的模型,这个模型通过累加计算每个维度的特征与各自权重的乘积来帮助类别决策。
线性关系公式 :f(w,x,b)=w^tx+b
x=(x1,x2,…xn) 代表n维特征列向量,w=(w1,w2,…wn)代表对应的权重(系数 coeffient),同时为了避免其过坐标原点这种硬性假设,增加一个截距(intercept) b。
f取值范围分布在整个实数域中.
线性其实就是一系列一次特征的线性组合,在二维空间中是一条直线,在三维空间中是一个平面。
logistic函数公式
要处理的最简单的二分类问题希望 f取值为 0 或1值,因此引入logistic函数
将 f(w,x,b) 代替 x ,当 x =0时, f(x)为0.5, 若 x<0, f(x) <0.5, 若 x>0,则 f(x)>0.5
当使用一组m个用于训练的特征向量X=(x1,x2,,…xm) 和其所对应的分类目标 y=(y1,y2,,…ym), 我们希望logistic模型可以在这组训练集上取得最大似然估计的概率