现有鸢尾花数据集iris.csv。Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣
长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。
具体要求:
- 使用逻辑回归模型训练鸢尾花数据集,测试集取20%,训练集取80%。
- 先对数据进行标准化后,分别采用多项式的次数为1-9进行训练,solver和multi_class请自行选择。
- 分别在控制台打印出多项式次数为1-9时,该模型在测试集上预测出准确分类的正确率。
import numpy as np
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler, PolynomialFeatures
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.pipeline import make_pipeline
if __name__ == "__main__":
pa