1.基本术语
数据集:记录的集合;
实例(instance):关于一个对象或事件的描述;
训练:从数据中学得模型的过程,可通过执行某个算法来完成;
训练数据
训练样本
学习任务
分类:预测的是离散值,比如 “好”、“坏”;
回归:预测的是连续值,比如 成熟度;
2.假设空间
归纳偏好:算法在机器学习过程中对某种假设的偏好;
归纳
演绎
3.归纳偏好
“奥卡姆剃刀”原则:若有多个假设与观察一致,则选最简单的那个
NFL定理:没有免费的午餐。算法没有优劣好坏,针对具体问题具体分析