机器学习:资料(数据)做为输入/输出 找到最合适的算法公式
机器学习的分类:
监督式学习 supervise learning
无监督式学习 unsupervise learning
半监督式学习
在线学习 online learning
强化学习 active learning
有批量(batch)数量的情况下可应用
监督式学习(知道输入与输出)
半监督式学习是(知道输入与部分输出)
无监督式学习(不知道输出):对应着聚类 clustering
没有批量(batch)数据的情况下可应用
在线学习:由用户的一条条数据做为算法的输入对算法进行改进修正
强化学习:在输入每条数据上给定定义与惩罚项来做为输入提高算法的准确度
对于机器学习的输出:
1.有明确的分类(是/否)并且是用一条线可以分开的 对应的是分类
2.有多个输出结果 对应的是多分类
3.输出在某一个区间 对应的是回归 regression
对于机器学习的输入:
1. 有确切的数据在做为输入之前需要进行一些处理:标准化/归一化/泛化等我们称为预处理 preconditioning
2. 没有确切的数据需要我们自己定义或从数据中提取信息特征我们称为特征工程 feature engineering