一. 数据集
这个经典实验的数据集并不是一堆图片,而是一张表。
a) 实验使用sklearn.datasets中的鸢尾花的数据集以及标签,数据集为150行4列。
b)
二. 选择分类器
a) 使用支持向量机进行分类。
三. 实验流程
a) 将数据集标签集一起随机排列,取70%的数据为训练集,30%的数据留作测试集。
b) 构建SVM分类器
c) 模型训练
d) 模型评估
四. 代码
import numpy as np
from matplotlib import colors
from sklearn import svm
from sklearn import model_selection
import matplotlib.pyplot as plt
import matplotlib as mpl
from sklearn.datasets import load_iris
#**********************SVM分类器构建*************************
def classifier():
clf = svm.SVC(C=0.5, #误差项惩罚系数,默认值是1
kernel='linear', #线性核 kenrel="rbf":高斯核
decision_function_shape='ovr') #决策函数
return clf
#***********************训练模型*****************************
def train(clf,x_train,y_train):
clf.fit(x_train, #训练集特征向量
y_train.ravel()) #训练集目标值
#**************并判断a b是否相等,计算acc的均值*************
def show_accuracy(a, b, tip):
acc = a.ravel() == b.ravel()
print('%s Acc