Datawhale 西瓜书第三章

最新推荐文章于 2025-09-16 12:12:32 发布

原创最新推荐文章于 2025-09-16 12:12:32 发布 · 193 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文介绍了线性模型如何解决二分类和多分类问题，包括线性回归、对数几率回归（逻辑回归）以及线性判别分析（LDA）。线性回归通过均方误差作为损失函数；对数几率回归引入sigmoid函数处理分类问题，损失函数采用交叉熵；LDA作为一种降维方法，目标是最大化类别间方差。

本章主要介绍线性模型进行二分类和多分类问题。

1、线性回归线性回归模型在机器学习中应用广泛，通常，线性模型表示为属性的显性组合，即

$f(x)=w_1x_1+w_2x_2+...+w_dx_d+b$

更一般的形式为： $f(\textbf{x})=\textbf{w}^T\textbf{x}+\textbf{b}$

损失函数定义为真实值与预测值之间的差，通常使用均方误差来表示：

$E_{(w, b)} = \sum_{i=1}^m(f(x_i) - y_i)^2 = \sum_{i=1}^m(wx_i + b - y_i)^2$

2、对数几率回归

显性回归通常用于模型对真实样本的拟合，无法解决分类问题，为此，对数回归几率模型引入单调可微的sigmoid函数（与深度学习中的激活函数类似），也叫逻辑函数，定义为：

$f(z) = \frac{1}{1 + e^{-z}}$

对数几率回归的损失函数定义为：

$L(w,b) = \prod_{i=1}^m P(y_i|x_i;w, b)$

使用极大似然估计对模型参数进行估计，就可以得到对数几率回归模型。

3、线性判别分析（LDA）

此LDA模型非主体模型中的LDA（Latent Dirichlet Allocation），其实是一种降维的方法，将样本投影到二维的直线上。该模型的目标函数为：

$J = \frac{\parallel w^T \mu_0 - w^T \mu_1 \parallel_2^2}{w^T \sum_0 w + w^T \sum_1 w} = \frac{w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w}{w^T (\sum_0 + \sum_1) w}$

评论 1

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。