1、逻辑回归
Logistic回归是一种广义线性模型(generalized linear model),一般用于分类问题。其因变量可以是二分类的,也可以是多分类的。
如果因变量是连续的,就是多重线性回归;
如果因变量是二项分布,就是Logistic回归;
如果因变量是Poisson分布,就是Poisson回归;
如果因变量是负二项分布,就是负二项回归。
逻辑回归与线性回归的区别在于:增加了一个logitstic函数,把输出从负无穷到正无穷,压缩到0和1之间,变成概率(可能性)
2、逻辑回归分类器
2.1 原理
逻辑回归分类器(multinonial logistic classification)
原理图
计算过程
输入一个样本X—>logit分数—>概率值probability—>标签向量label
其中用到了线性模型、softmax函数和One-Hot编码。
2.2 模型构建
广义线性模型:向量表示。
y=wx+b
softmax函数:把结果(score/logit)转换成概率(probability),结果越大,概率越大;概率之和为1。
softmax(a) 当a为数组时,返回相同大小的数据;当a为矩阵时,返回相同大小的矩阵,将每一列看作一个样本,因此每一列的和为1。
注意:等比例增加数组a中的每一个值,可以分类更加明显,比如,softmax(10*a)与softmax(a/10)的区别。
sigmoid和softmax函数的区别:
sigmoid将一个实数real value映射到(0,1)的区间
s(x)=L