1、机器学习基础入门

最新推荐文章于 2025-11-30 15:25:22 发布

grape

最新推荐文章于 2025-11-30 15:25:22 发布

阅读量9

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习算法实战精解文章标签：机器学习监督学习无监督学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/grape/article/details/152426004

机器学习算法实战精解专栏收录该内容

18 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习基础入门

机器学习在当今科技领域中占据着至关重要的地位，它可以大致分为监督学习和无监督学习。监督学习意味着系统借助有标签的训练数据进行学习，就像给系统展示一组带有猫和狗标签的图片，让它识别猫和狗的特征。而无监督学习则是将数据分组到相似的类别中，例如输入一组猫和狗的图片，不说明每张图片所属类别，让系统根据图片的相似性进行分组。

1. 回归与分类

回归：回归通常用于预测连续变量。例如，预测某个地区夏季每周可乐的销售数量，其值可能在100万到120万单位之间。线性回归就是预测连续变量的典型技术。
分类：分类用于预测具有少数不同结果的事件，比如预测一天是晴天还是雨天。逻辑回归是预测离散变量的典型技术。此外，决策树、随机森林、梯度提升机（GBM）、神经网络等技术也可用于预测连续和离散结果。

下面用表格展示回归和分类的区别：
| 类型 | 适用场景 | 典型技术 |
| ---- | ---- | ---- |
| 回归 | 预测连续变量，如可乐销量 | 线性回归 |
| 分类 | 预测离散结果，如天气情况 | 逻辑回归 |

2. 训练数据与测试数据

在回归问题中，常常会遇到泛化和过拟合的问题。当模型过于复杂，能够完美拟合所有数据点，导致误差率极小，就会出现过拟合现象。例如，在一个数据集中，直线不能完美拟合所有数据点，而曲线可以，但直线在新数据集上更具泛化能力。

随着模型复杂度的增加，未见过的数据点（即测试数据）的误差率会先降低，然后开始上升，而训练数

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。