基于scikit - learn和FastAPI的机器学习模型训练与预测API构建
1. 支持向量机(SVM)基础与应用
1.1 简单分类问题的直观理解
考虑一个简单的分类问题,目标是将样本分为两类。直观上,对于一些随机生成的数据,找到一条直线来清晰地分隔这两类似乎很简单。但实际上,存在很多不同的分隔直线,如下图所示(此处省略图)。
1.2 SVM的工作原理
SVM会在每个可能的分类器周围绘制一个边界,直到最近的点。选择使边界最大化的分类器作为模型。与边界接触的两个样本被称为支持向量。
在现实世界中,数据往往不是线性可分的。SVM通过应用核函数将数据集投影到更高维度来解决这个问题。核函数可以计算每对点之间的相似度,在新的维度中,相似的点靠近,不相似的点远离。例如,径向基函数(RBF)是scikit - learn中使用SVM时默认应用的核函数。
1.3 在scikit - learn中使用SVM
SVM有不同的类型,SVC估计器适用于分类问题,SVR通常适用于回归问题。以下是使用SVC估计器进行手写数字识别的示例代码:
from sklearn.datasets import load_digits
from sklearn.model_selection import cross_val_score
from sklearn.svm import SVC
digits = load_digits()
data = digits.data
targets = digits.target
# Create t
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



