
机器学习
不想当筛子
一个Java程序员
展开
-
西瓜书读书笔记:第一章 绪论
主要符号表样本空间:以样本的属性为坐标轴张成的多维空间,也叫属性空间、输入空间概率分布:表示随机变量取值的概率规律,随机试验的概率分布即随机变量的概率分布假设空间:由输入空间到输出空间的映射的集合,即模型的集合版本空间:用训练集对假设空间进行匹配,即能对训练集中的样本进行正确预测的假设集合概率质量函数:离散随机变量在各特定取值上的概率的函数概率密度函数:连续随机变量在某个确...原创 2018-10-08 17:37:42 · 431 阅读 · 0 评论 -
西瓜书读书笔记:第二章 模型评估与选择
2.1经验误差与过拟合错误率:分类错误的样本数占样本总数的比例精度accuracy:1-错误率误差:学习器的实际预测输出与样本的真实输出之间的差异训练误差training error/经验误差empirical error:学习器在训练集上的误差泛化误差:在新样本上的误差过拟合overfitting:泛化性能低,各类学习算法都对过拟合有缓解的措施但无法彻底避免。机器学习面临...原创 2018-10-10 08:57:34 · 375 阅读 · 0 评论