众所周知,鸢尾花根据 '花瓣长度','花瓣宽度','花萼长度','花萼宽度',分为三类,在数据集中分别用0,1,2来表示类别
本次就是通过对鸢尾花特征进行训练来判断出为哪一类,用到了分类算法的4个模型
一 导入库函数和数据集,该数据已经分好了训练集和测试集,直接导入
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data_train = pd.read_csv('./iris_training.csv',encoding='gbk') //训练集
data_test = pd.read_csv('./iris_test.csv',encoding='gbk') //测试集
分别将训练集和测试集中的标签和特征提取出来
//训练集
new_train = data_train[['花瓣长度','花瓣宽度','花萼长度','花萼宽度']].values# 鸢尾花训练集特征值(4个)
new_train.shape
iris_target = data_train['类别'].values
iris_target.shape
//测试集
new_test = data_test[['花瓣长度','花瓣宽度','花萼长度','花萼宽度']].values# 鸢尾花测试集特征值(4个)
new_test.shape
iris_target_test = data_test['类别'].values
iris_target_test.shape
二 数据规约
<