- 利用经验E学习任务T,性能是P,如果针对任务T的性能P随着经验E不断增长,则成为机器学习
- 分类问题,监督学习,非监督学习,半监督学习和强化学习。
- 监督学习:分类和回归
- 非监督学习:聚类、降维、异常检测和关联规则学习
- 半监督学习:深度信念网络(deep belief networks)
- 强化学习:对环境进行观察,选择和执行动作,获得奖励(负奖励是惩罚,见下图)。然后它必须自己学习哪个是最佳方法(称为策略,policy)
- 即监督学习所用的训练集,数据项自带有类别,可进行分类和回归。
- 分类和回归
- 聚类,降维,异常检测,关联规则学习
- 强化学习
- 聚类算法
- 监督学习问题
- 即可边提交边学习
- 于超大数据集(超过一台计算机的主存储器的数据),进行在线学习。将数据分割成小批量,然后使用在线学习技术从这些小批量中学习。
- 非监督学习算法
- 模型参数和学习算法超参数
- 最佳的参数设置;
- 训练数据量不足;不相关的属性;没有代表性的数据;低质量的数据
- 过拟合
- 简化模型
- 组合特征
- 去除异常值
- 留用测试训练集学习结果的数据集
- 验证超参数设置的效果如何
- 超参数虽然对于测试集准确度更高,但对于实际使用反而可能下降,这是由于用测试集调整超参数,模型在此过程进行了学习和调整模型内参数。使其更贴合测试集
- 为什么要使用交叉验证?