目录
1 sigmoid
1.1 sigmoid的简单推理
在使用逻辑回归做二分类问题时,sigmoid函数常用作逻辑回顾的假设函数,从直觉上理解很好理解,就是在线性回归的基础上套一个sigmoid函数,将线性回归的结果,映射到
范围内,使他变为一个二分类问题。但是在sigmoid背后有一套严谨的数学推导,包括sigmoid函数时怎么推导出来的,为什么使用丝sigmoid函数。
逻辑回归和线性回归同属一个广义线性模型,顾名思义,这些模型有相似之处,实在同一套约束下设计出来的。例如解决一个二分类问题,首先假设这个问题可以使用广义线性模型来解决,其次假设数据的概率分布情况,发现是二分类问题,假设数据服从伯努利分布,然后使用MLE计算最优化的概率,从而学习参数的值。具体解释可以参考之前写的这篇:广义线性模型总结(GLM)。
广义线性模型有一些性质,这些模型的数据分布同属指数分布族,概率密度函数的通式如下:
其中:
:分布的自然参数(natural parameter)或标准参数(canonical parameter)
:充分统计量(sufficient statistic),一般等于y
:对数分配函数(log partition function),这部分确保Y的分布p(y:η) 计算的结果加起来(连续函数是积分)等于1。
:基础度量值(base measure)
将伯努利分布的概率密度函数套入这个指数分布族的概率密度函数中,可以一一对应的找到、
、
、
四个值。