第3关:支持向量机分类模型及其应用
任务描述
本关任务:基于关卡2基础上,取数据集前600条记录作为训练数据,后90条记录作为测试数据,构建支持向量机模型,输出其模型准确率和预测准确率。
相关知识
为了完成本关任务,你需要掌握:1.获取数据和数据处理。2.训练样本与测试样本划分。3、支持向量机分类模型构建。
训练样本与测试样本划分
训练用的特征数据用x1表示,预测变量用y1表示,测试样本则分别记为x2和y2。
x1 = x.iloc[:600,:]
y1 = data.iloc[:600,15]
x2 = x.iloc[600:,:]
y2 = data.iloc[600:,15]
输出:
支持向量机分类模型构建
支持向量机分类模型的构建具体步骤如下:
(1)导入支持向量机模块svm。
from sklearn import svm
(2)利用svm创建支持向量机类`svm`。
clf = svm.SVC(kernel='rbf')
其中核函数可以选择线性核、多项式核、高斯核、sig核,分别用`lin