逻辑回归的目标函数

对于逻辑回归,模型有两个参数,分别是w和b,前者是向量并表示每个特征的重要性,后者是偏移量(Intercept)。这些参数是需要去估计的。但现在我们唯一能拿到的是观测样本,这就意味着我们需要通过观测样本去估算最好的模型参数。
这个问题也可以这么思考:有个未知的模型类似黑盒子,它产生了很多能看得见的样本。那这时候,我们其实可以通过最大化看到这些样本的概率来反推出模型最优的参数,这种方法叫做最大似然估计。

最大似然估计是机器学习领域最为常见的用来构建目标函数的方法,它的核心思想是根据观测到的结果来预测其中的未知参数.
下面以一个例子来深入了解一下什么叫最大似然:

假设有一枚硬币,它是不均匀的,也就是说出现正面和反面的概率是不同的,假设我们设定这枚硬币出现正面的概率为θ,我们用H来指正面,用T来标记反面,假设我们投掷6次后得到了以下的结果,而且我们假定每次投掷都是相互独立的事件,则θ值为多少?
在这里插入图片描述
对于逻辑回归模型如何构造最大似然?

在这里插入图片描述
对于最大似然,无非就是把所有的样本全部考虑进来。这里需要注意的一点是,这个总概率是由每一个条件概率的乘积来表示的。 随后,通过最大化这个条件概率来得出最优的参数w和b。

​有了目标函数之后,我们的任务就比较明确了,就是需要寻找让目标函数最大化的参数w和b。 所以,接下来的问题就变成了一个经典的优化问题。

### 逻辑回归目标函数优化求解方法 #### 损失函数定义 逻辑回归用于解决二分类问题,其核心在于估计给定输入特征下属于某一类别(通常是正类)的概率。为了评估模型预测的好坏并调整参数,引入了损失函数的概念。对于单个训练样本而言,如果采用对数似然作为衡量标准,则对应的负对数似然即构成了该样本上的损失[^3]。 #### 目标函数形式 当面对整个训练集时,总体的目标函数可以通过累积各个单独样本的损失值得到。具体来说,在不考虑正则项的情况下,逻辑回归试图最小化的成本函数J(θ)可表达为: \[ J(\theta) = - \frac{1}{m} \sum_{i=1}^{m}[y^{(i)}log(h_\theta(x^{(i)}))+(1-y^{(i)})log(1-h_\theta(x^{(i)}))] \] 其中\(h_\theta(x)\)=g(z),而z=\(\theta^Tx\);g代表Sigmoid激活函数\[ g(z)=\frac {1}{1+e^{-z}} \][^1]。 #### 参数更新策略 为了找到使上述目标函数达到极小值的最佳权重向量θ*,常用的方法有梯度下降法以及更高级别的最优化技术比如牛顿迭代法等。这些算法的核心思想都是沿着当前点处的成本曲面斜率方向逐步移动直至收敛至局部最优解附近停止变化为止[^2]。 - **梯度下降**:这是一种简单直观的方式,每次按照一定步长沿反比例于当前位置导数值的方向前进一小段距离完成一次迭代更新操作直到满足预设终止条件如最大循环次数到达或相邻两次计算所得误差绝对差小于指定阈值。 ```python def gradient_descent(X, y, theta, alpha, num_iters): m = len(y) J_history = [] for i in range(num_iters): h = 1 / (1 + np.exp(-np.dot(X, theta))) loss = h - y grad = np.dot(X.T, loss) / m # 更新参数 theta -= alpha * grad # 记录代价函数的变化情况 cost = (-y*np.log(h)-(1-y)*np.log(1-h)).mean() J_history.append(cost) return theta, J_history ``` - **牛顿法/拟牛顿法**:相较于前者仅利用了一阶偏导信息指导寻优路径的选择,后者还额外借助Hessian矩阵描述二次近似的几何特性从而加速逼近过程提高效率尤其适合高维空间下的复杂非线性映射关系建模任务。 #### 实际应用场景中的实现方式 尽管理论上可以自行编写代码实现以上提到的各种优化器,但在实践中往往推荐直接调用成熟的机器学习框架所提供的接口来简化工作流程降低开发难度同时保障性能表现。例如Python环境下流行的scikit-learn库就内置了一个名为`LogisticRegression` 的类支持多种配置选项方便快捷地构建高效稳定的LR分类器实例。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值