先来看一些基本概念
什么是统计学?
基于数据构建统计模型 从而对数据进行预测与分析。
什么是监督学习?
学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。(有标签学习)
根据输入,输出变量的不同类型,对预测任务给予不同的名称。
回归问题: 输入,输出均为连续变量。
分类问题: 输出变量为有限个离散变量。
过拟合
学习时选择的模型所包含的参数过多,以致于出现这一模型对已知数据预测得很好,但对未知数据预测得很差的现象。

泛化能力
模型对未知数据的预测能力。测试误差越小,泛化能力越好。
K近邻法(KNN)
对特征空间的划分:掌握距离量度,K值的选择,分类决策规则。
SVM支持向量机(不想写,直接上图)



本文介绍了统计学的基本概念,包括监督学习、回归问题、分类问题、过拟合与泛化能力等核心知识点,并简述了K近邻法和SVM支持向量机的基本原理。
1608

被折叠的 条评论
为什么被折叠?



