机器学习概述
学习地址https://zh.d2l.ai/chapter_introduction/index.html
机器学习的关键组件
数据
- 数据集由大量样本组成
- 样本由特征向量和标签组成
- 特征向量的长度称为数据的维数
- 每一个样本独立同分布
- 数据的准确性很重要,垃圾数据导致垃圾的输出
- 数据的量也很关键,大量的数据训练出更加强大的模型。
模型/机器学习算法
- 模型用于数据的转换,模型即解决问题的方法,可以是简单的机器学习算法,也可以是复杂的深度学习模型
目标函数(损失函数)
- 用于度量模型效果的函数,常见的方法是平方误差,由于求的是误差,所以越小越好,所以也称为损失函数
优化算法
- 用于优化目标函数结果的算法,常见的方法有梯度下降法。
机器学习解决哪些问题
监督学习问题
-
线性回归
- 解决预测数值类问题
-
分类
- 解决预测类别问题
-
标记
- 解决打标签问题
-
搜索