西瓜书_chapter3_线性模型

最新推荐文章于 2025-04-26 09:29:57 发布

lirt15

最新推荐文章于 2025-04-26 09:29:57 发布

阅读量215

点赞数

分类专栏：西瓜书笔记文章标签：机器学习

本文链接：https://blog.youkuaiyun.com/lirt15/article/details/92796628

版权

本文深入探讨线性模型，包括线性回归的一元和多元情况，对数线性回归，对数几率回归（逻辑回归）以及线性判别分析。介绍了线性模型的基本形式，利用均方误差度量模型性能，通过拉格朗日乘子法解决约束优化问题，并讨论了多分类技术和样本不均衡问题的应对策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

3.1 基本形式

$f(x)=\omega_1 x_1 + \omega_2 x_2+... +\omega_dx_d+b$
其中， $x_i$ 是x在第i个属性上的取值，也可以写成
$f(x)=\omega^Tx+b$
公式中的 $\omega$ 比较直观地反应了每个属性的重要性，因而线性模型具有很好的可解释性(comprehensibility)。

3.2 线性回归

3.2.1 一元情况

线性回归的目的是学得
$f(x_i)={\omega} x_i+b, 使得f(x_i)=y_i$
在回归任务中，我们通常使用均方误差来度量模型的性能
$(w^*,b^*)= \mathop{argmin}\limits_{(w, b)} \sum_{i=1}^{m}(f(x_i)-y_i)^2$
由于上式的右侧对于 $\omega,b$ 是凸函数，因此可以采用求偏导取0的方式求得最值点。

3.2.2 多元情况

更一般地，如果我们把属性值扩充为多个，上述的问题就变为了多元线性回归问题。为了方便讨论，我们把 $\omega$ 和 $b$ 合在一起写为 $\hat{w}=(\omega;b)$ 的形式，把数据集也用矩阵表示
$\left[ \begin{matrix} x_1^T & 1\\ x_2^T & 1\\ ... & ...\\ x_m^T & 1\\ \end{matrix} \right]$