首先下几个结论:
1、逻辑回归是广义线性模型(注意,不是严格的:线性模型)
2、逻辑回归处理的是二分类,源自于y的分布:二项分布。
接着,逻辑回归的几个问题:
1、逻辑回归,为什么叫回归,却处理分类问题。
2、逻辑回归怎么就是广义线性模型了?广义线性体现在哪里?
3、逻辑回归的决策边界是什么样的?
我的想法:
1、逻辑回归的直观形式:
逻辑回归的假设函数:,其中θ就是我们要的参数,x就是自变量(特征),单独看-θ*x,这就是一个回归拟合,取值在负无穷到正无穷之间,而e^(-θ*x)则将回归结果压缩到0到正无穷,而完整的假设函数使得当初的回归值被压缩到了0到1之间。而0到1本身可以看成概率值。也就是本来该拟合的值都会与0到1之间的某个值相对应,我们就可以拿0到1之间的某个值作为阈值,从而可以进行二分类。这样就将回归与分类结合到了一起。
2、逻辑回归为什么被称作广义线性模型?
从之前的博客:
https://blog.youkuaiyun.com/h_jlwg6688/article/details/89327402
可以看到逻辑回归符合线性模型的判定条件,所以逻辑回归是线性模型?肯定很多人表示怀疑,所以之前的博客可能还不够严谨,逻辑回归是更加抽象的线性模型,即:广义线性模型。
为什么会有广义线性模型这个概念呢?
我目前的总结是:
参考博客:https://blog.youkuaiyun.com/xierhacker/article/details/53316138
为了对客观世界的统一(分布)。
比如有类事件或者事物,它们本身有自己的分布规律,
2.1、像线性回归,它假设的是因变量y,自变量x和误差项都符合高斯分布,参考:
https://blog.youkuaiyun.com/xierhacker/article/details/53316138
复述:
首先假设目标变量和输入与下面这个方程相关:
其中是一个误差项(error term),来捕捉一些我们建模的时候故意或者无意忽略但是对于预测有影响的因素。有时候也可以作为一个随机的噪声(random noise)。“误差项(噪声项