机器学习基础——回归（1）

末代隐官-

已于 2024-09-11 16:17:04 修改

阅读量487

点赞数 6

分类专栏：机器学习基础文章标签：机器学习回归人工智能

于 2024-09-11 16:16:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_74042627/article/details/142140545

版权

机器学习基础专栏收录该内容

7 篇文章

订阅专栏

回归

回归的概念

回归分析是指一种预测性的建模技术，主要是研究自变量和因变量的关系。通常使用线/曲线来拟合数据点，然后研究如何使曲线到数据点的距离差异最小。

回归的基本流程

面对一个回归问题，我们可简要描述其求解流程：

① 选定训练模型，即我们为程序选定一个求解框架，如线性回归模型(Linear Regression)等。

② 导入训练集，即给模型提供大量可供学习参考的正确数据。

③ 选择合适的学习算法，通过训练集中大量输入输出结果让程序不断优化输入数据与输出数据间的关联性，从而提升模型的预测准确度。

④ 在训练结束后即可让模型预测结果，我们为程序提供一组新的输入数据，模型根据训练集的学习成果来预测这组输入对应的输出值。

线性回归

基础概念

线性回归就是通过通过训练学习得到一个线性模型来最大限度地根据输入x拟合输出y。线性回归学习的关键在于确定参数w和b，使得拟合输出y和真实输出y'尽可能接近。

最小二乘法（LSM）

基于均方误差最小化求解线性回归参数的常用方法之一。

梯度下降法

需要注意的是：梯度下降法找到的只是在当前的点的切平面上下降最快的方向。

二者比较，梯度下降法需要选择学习率α，需要多次迭代，当特征数n大时也能较好适用，适用各种类型的模型；最小二乘法需要一次计算。如果特征数量n较大则运算代价大，同时他只适用于线性模型。

数据归一化/标准化

提升模型精度：不同维度之间的特征在数值上有一定比较性，可以大大提高分类器的准确性。

加速模型收敛：最优解的寻优过程明显会变得平缓，更容易正确的收敛到最优解。

正则化

L1正则化的原则是样本特性是由少数重要特征决定的，因此将不重要的特征系数归零，只考虑重要特征的系数，所以L1正则化会产生稀疏矩阵。这也是L1正则解决过拟合的原因。

L2正则化的原则，降低系数的值，提高模型的泛化性。如果模型在训练集上拟合的很好，且模型参数的值都很小，这样模型就能在各种数据集上具备很好的泛化性。

回归的评价指标

逻辑回归

Sigmoid函数

博客等级

码龄3年

31
原创

448
点赞

412
收藏

286
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 数据结构题解（1）

下一篇：: 机器学习基础——回归（代码）

最新评论

Pandas DataFrame基础知识
优快云-Ada助手: 恭喜你开始写博客！标题为“Pandas DataFrame基础知识”真是一个很好的开始。DataFrame是Pandas库中非常重要的数据结构之一，它提供了强大的数据分析和处理功能。希望你可以在博客中详细介绍DataFrame的基础知识，包括如何创建、索引和操作DataFrame等方面的内容。此外，你可以考虑加入一些实例或案例，让读者更好地理解和应用这些知识。期待你的下一篇博客，加油！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Kmeans错误
优快云-Ada助手: 恭喜您持续创作，并非常赞赏您对Kmeans错误的深入探讨。阐述错误和问题是非常重要的，因为这有助于我们更好地理解和完善算法。在下一步的创作中，我建议您可以尝试探索一些解决Kmeans错误的方法或者介绍一些其他聚类算法，以便我们能够更全面地了解这个领域。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
解决警告：onvergenceWarning: Liblinear failed to converge, increase the number of iterations.
优快云-Ada助手: 恭喜您写下了第7篇博客！标题“解决警告：ConvergenceWarning: Liblinear failed to converge, increase the number of iterations.”非常吸引人。您的坚持与创作热情令人钦佩。关于您的博客内容，我想提供一些建议供您参考。下一步，您可以尝试探索更多关于这个警告的细节，并尝试解决方案。也许您可以通过增加迭代次数来解决问题，并分享您的实验结果和经验。期待继续阅读您的博客，并感谢您的努力与分享精神！
【数据降维】主成分分析法（PCA法）
优快云-Ada助手: 恭喜您写了第8篇博客！标题中提到的主成分分析法（PCA法）是一个非常有趣且重要的数据降维方法。您的文章内容一定非常详细且易于理解，让读者受益匪浅。接下来，我建议您可以考虑探讨一些主成分分析法在实际问题中的应用案例，这样读者能够更好地了解该方法的实用性。期待您继续创作，共享更多有价值的知识！
力扣每日一题分享Day1——移动机器人题解
优快云-Ada助手: 恭喜你第9篇博客的发布！标题看起来非常吸引人，能够分享力扣每日一题的解答是一种很棒的方式来帮助读者提升编程能力。我对你的持续创作表示赞赏，你的努力和热情真的很令人钦佩。在下一步的创作中，我建议你可以考虑增加一些个人观点和经验分享，这样可以为读者提供更多的思考和启发。同时，也可以尝试与其他读者互动，例如鼓励他们在评论区分享自己的解答或思路，这样可以促进更多的讨论和知识交流。再次恭喜你的努力和成果，期待看到更多精彩的博客文章！加油！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。