线性模型

最新推荐文章于 2024-04-07 20:10:55 发布

原创最新推荐文章于 2024-04-07 20:10:55 发布 · 860 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

机器学习专栏收录该内容

2 篇文章

订阅专栏

本文详细介绍了线性模型的基本形式及特点，并深入探讨了线性回归的不同类型，包括二元线性回归、多元线性回归等，同时介绍了对数几率回归及其在概率预测中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 基本形式

1.1 公式

f (x) = w T x + b

$f(x)=w^Tx+b$
其中，

x=(x1;x2;...;xd) $x=(x_1;x_2;...;x_d)$ ，

xi $x_i$ 是

x $x$ 在第

i $i$ 个属性上的取值，

w=(w1;w2;...;wd) $w=(w_1;w_2;...;w_d)$

1.2 特点

线性模型形式简单、易于建模，有很好的可解释性
功能强大的非线性模型可在线性模型的基础上通过引入层级结构或高维映射而得。

2. 线性回归

2.1 二元线性回归

(w *, b *) = arg min (w, b) \sum i = 1 m (f (x i) - y i) 2 = arg min (w, b) \sum i = 1 m (y i - w x i - b) 2

$(w^*,b^*)=\mathop{\arg\min}_{(w,b)}\sum_{i=1}^m(f(x_i)-y_i)^2\\=\mathop{\arg\min}_{(w,b)}\sum_{i=1}^m(y_i-wx_i-b)^2$
其中，

w∗ $w^*$ 为

w $w$ 的解
基于均方误差最小化来进行模型求解的方法称为最小二乘法
将

E(w,b) $E_{(w,b)}$ 分别对

w $w$ 和

b $b$ 求导，再令式为零即可得

w $w$ 和

b $b$ 的最优解闭式

w = \sum m i = 1 y i ( x i - x ¯ ) \sum m i = 1 x 2 i - 1 m ( \sum m i = 1 x i ) 2

$w=\frac{\sum_{i=1}^my_i(x_i-\bar{x})}{\sum_{i=1}^mx_i^2-\frac{1}{m}({\sum_{i=1}^mx_i})^2}$

2.2 多元线性回归

令 $\hat{w}=(w;b)$ ， $X=\begin{bmatrix} x_{11}&x_{12}&\cdots&x_{1d}&1\\ x_{21}&x_{22}&\cdots&x_{2d}&1\\ \vdots&\vdots&\ddots&\vdots&\vdots\\ x_{m1}&x_{m2}&\cdots&x_{md}&1 \end{bmatrix}$ ， $y=(y_1;y_2;…;y_m)$
则 $w^Tx_i+b =X\hat{w}$
则

w^* = arg min w^(y - X w^) T (y - X w^)

$\hat{w}^*=\mathop{\arg\min}_{\hat{w}}(y-X\hat{w})^T(y-X\hat{w})$
令

Ew^=(y−Xw^)T(y−Xw^) $E_{\hat{w}}=(y-X\hat{w})^T(y-X\hat{w})$ ，对

w^ $\hat{w}$ 求导得到

\partial E w ^ \partial w ^= 2 X T (X w^- y)

$\frac{\partial{E_{\hat{w}}}}{\partial{\hat{w}}}=2X^T(X\hat{w}-y)$
令上式为零可得

w^ $\hat{w}$ 最优解的闭式解。

若 $X^TX$ 为满秩矩阵或正定矩阵时， $\hat{w}^*=(X^TX)^{-1}X^Ty$ ，令 $\hat{x}^*=(x_i;1)$ ，则最终学得的多元线性回归模型为

f (x i^) = x i^T (X T X) - 1 X T y

$f(\hat{x_i})=\hat{x_i}^T(X^TX)^{-1}X^Ty$
若

XTX $X^TX$ 不是上述矩阵，如变量数超过样例数，矩阵不满秩，此时可以解出多个

w^ $\hat{w}$ ，它们都能使均方误差最小化，选择哪一个解作为输出，将由学习算法的归纳偏好决定，常见的做法是引入正则化。

2.3对数线性回归(log-linear regression)

ln y = w T x + b

$\ln{y}=w^Tx+b$

2.4广义线性模型

y = g - 1 (w T x + b)

$y=g^{-1}(w^Tx+b)$
其中，

g(⋅) $g(\cdot)$ 为单调可微函数，称为联系函数

3. 对数几率回归(logistic regression)

3.1 公式

对于二分类问题，上述 $g(\cdot)$ 函数可取Sigmoid函数

y = 1 1 + e - ( w T x + b )

$y=\frac{1}{1+e^{-(w^Tx+b)}}$
类似于对数线性回归式，得

ln y 1 - y = w T x + b

$\ln{\frac{y}{1-y}}=w^Tx+b$
其中

y $y$ 为样本

x $x$ 作为正例的可能性，

1−y $1-y$ 为样本

x作为反例的可能性

3.2 特点

直接对分布可能性建模，无需事先假设数据分布，避免了假设分布不准确所带来的问题
它不仅预测出“类别”，而是可得到近似概率预测，对于许多利用概率辅助决策的任务很有用
对率函数是任意阶可导的凸函数，有很好的数学性质，现有的许多数值优化算法都可直接用于求取最优解

参考书籍: 《机器学习》周志华

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。