从零开始-Machine Learning学习笔记(3)-线性回归中的特征缩放与正规方程

kabuto_hui

于 2018-03-07 16:41:26 发布

阅读量976

点赞数

分类专栏：机器学习从零开始-Machine Learning学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/kabuto_hui/article/details/79473423

版权

机器学习同时被 2 个专栏收录

49 篇文章

订阅专栏

从零开始-Machine Learning学习笔记

45 篇文章

订阅专栏

1.特征缩放

我们在使用多元线性回归的时候，会有多个变量，每个变量的量纲不一样导致其数值上也会不一样。比如我们对与房屋价格的预测上，房间的大小的单位是平方米，其数值大小在几十到几百，而房间数则是一个10以内的数值。如果我们绘制代价函数J的等高线图就可以清楚的看到特征之间的数值差异过大会导致等高线图呈现一个扁长的状态，而这样会导致梯度下降算法要迭代很多次才能收敛。

这里写图片描述

因此，为了解决这个因为数值差异过大而导致的收敛速度慢的问题，我们应该在进行梯度下降之前对这些数值做一些缩放，这就是所谓的特征缩放。通常，我们将所有的特征尺度都缩放到[-1,1]之间。所使用的手段一般为均值归一化：

x n = x n - μ n m a x - m i n

$x_{n} = \frac{x_{n}-\mu_{n}}{max-min}$
其中，

μn μ n $\mu_{n}$ 是平均值。

2.多元线性回归的正规方程

所谓正规方程，就是通过矩阵运算的方式求出最优解的方法，之前我们一直采用的是梯度下降算法来求解我们回归方程中的未知量。现在则可以通过矩阵运算的方式来进行直接求解。具体的推导如下：

原 代 价 函 数 为 ： J = \sum i = 1 n (y i - f (x i)) 2 = \sum i = 1 n (y i - w x i) 2

$原代价函数为：J=\sum_{i=1}^{n}(y_{i}-f(x_{i}))^2=\sum_{i=1}^{n}(y_{i}-wx_{i})^2$

化 为 矩 阵 形 式 （ 正 规 方 程 ） ： J = (y - X w) T (y - X w)

$化为矩阵形式（正规方程）：J=(y-Xw)^T(y-Xw)$

代 价 函 数 对 w 求 偏 导 数 ： d J d w = 2 X T (X w - y)

$代价函数对w求偏导数：\frac{dJ}{dw} = 2X^T(Xw-y)$

令 这 个 偏 导 数 为 0 可 以 得 到 以 下 的 递 推 式 ： X T X w = X T y

$令这个偏导数为0可以得到以下的递推式：X^TXw=X^Ty$

最 后 可 以 得 到 w 的 表 达 式 为 ： w = (X T X) - 1 (X T y)

$最后可以得到w的表达式为：w=(X^TX)^{-1}(X^Ty)$

最后我们通过正规方程得到了最优的解向量。

显然，使用这种方式要保证 $(X^TX)^{-1}$ 要存在，即 $(X^TX)^{-1}$ 是正定矩阵。当 $(X^TX)^{-1}$ 不是行满秩的时候，会得到多个解向量，选择哪一个解作为输出将由学习算法的归纳偏好决定，常见的做法是引入正则化项。

博客等级

码龄10年

人工智能领域优质创作者

博客专家认证

168
原创

1539
点赞

4137
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

最新评论

安卓学习笔记(21)-flutter doctor时显示X Unable to locate Android SDK的解决方案
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
【大模型系列】一文看懂SAM大模型
kabuto_hui: 是的，只能区分目标和背景，也就是二分割。mask输出的形状为[b,1,h,w]时，输出的是目标的整体分割结果，还可以输出形状为[b,3,h,w]，输出的结果就是这个目标whole、part和subpart的部分，参考3.3小节。
【大模型系列】一文看懂SAM大模型
不想转生信的小张: 大佬大佬，mask_decoder输出的形状我看是[b,1,h,w]，是因为它只能做二分割吗？
【大模型系列】CogAgent(2024.12)
kabuto_hui: hello，我个人体验来看，cogagent的grounding能力还是比较好的。你遇到到的坐标完全不准确的可能是因为没有进行坐标转换。cogagent输出的坐标格式为[xmin,ymin,xmax,ymax]，且都是归一化为0~1000的，所以在实际使用时需要转换为原图坐标系： xmin = xmin / 1000 * img_w ymin = ymin / 1000 * img_h xmax = xmax / 1000 * img_w yamx = ymax / 1000 * img_h
【大模型系列】CogAgent(2024.12)
ws卍: 您好，请问您在实测过程中有遇到返回坐标不准确的问题吗，我使用modelscope上面的官方demo试了下，能精准的框出目标元素，但是返回的坐标是完全不准确的

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。