逻辑回归是有监督分类算法。
设带有标签的数据集
,
其中
。
我们定义条件概率函数:
,
,
即:
其中:
,
。
根据已知数据集我们定义极大似然函数:
。
,
对于最大化上式(属于无约束最优化),可以采用牛顿法或者梯度上升法,求最大值。
因为
,
所以
,
用牛顿法,对于处理分布式有些困难,我们用梯度上升法
即:
,
显然这一步可以通过MapReduce的原理。
本文深入探讨了逻辑回归作为有监督分类算法的应用,通过定义条件概率函数,介绍如何利用极大似然函数进行参数优化,并讨论了梯度上升法在分布式计算环境中的应用。
逻辑回归是有监督分类算法。
设带有标签的数据集
,
其中
。
我们定义条件概率函数:
,
,
即:
其中:
,
。
根据已知数据集我们定义极大似然函数:
。
,
对于最大化上式(属于无约束最优化),可以采用牛顿法或者梯度上升法,求最大值。
因为
,
所以
,
用牛顿法,对于处理分布式有些困难,我们用梯度上升法
即:
,
显然这一步可以通过MapReduce的原理。
5164
426
5061

被折叠的 条评论
为什么被折叠?