DT实现多特征数据分类预测,二分类及多分类附Python代码
决策树(Decision Tree, DT)是一种非常常见的机器学习算法,它通过根据特征值将数据不断分割为更小的子集来进行分类或回归任务。 它易于理解和解释,因此广泛用于预测建模。
在本文中,我们将使用Python语言实现决策树算法,并应用于多特征数据分类预测任务,包括二分类和多分类。
首先,我们需要准备数据。 在本例中,我们将使用一个经典的鸢尾花数据集作为示例。 此数据集包含150个观测值,每个观测值都有四个特征:花萼长度,花萼宽度,花瓣长度和花瓣宽度。 每个观测值属于三个类别之一:Iris Setosa,Iris Versicolour和Iris Virginica。
接下来,我们导入所需的Python库。 根据需要安装缺少的库。 在本例中,我们将使用Pandas,NumPy,Scikit-Learn和Matplotlib库。
import pandas as pd
import numpy as np
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import matplotlib