机器学习绘制决策边界

最新推荐文章于 2025-07-08 13:58:43 发布

原创

最新推荐文章于 2025-07-08 13:58:43 发布 · 8k 阅读

53 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #可视化

两个特征的决策边界绘制。

绘制决策边界

1.数据处理
2.绘制决策边界
3. 参考链接

1.数据处理

1.1 数据准备

使用 Iris 鸢尾花数据集，进行分析可视化。平面图只能绘制两个特征，这里我们也取数据集中的两列特征。

# 引入数据
from sklearn import datasets
import numpy as np

iris = datasets.load_iris()
# 'feature_names': ['sepal length (cm)','sepal width (cm)','petal length (cm)','petal width(cm)'],
#只取其中两个特征 第三列和第四列,[0,3]则代表取第一列和第四列
X = iris.data[:,[2,3]]  
y = iris.target
print("Class labels:",np.unique(y))  #打印分类类别的种类

1.2 数据集切分

# 切分训练数据和测试数据
from sklearn.model_selection import train_test_split
## 30%测试数据，70%训练数据，stratify=y表示训练数据和测试数据具有相同的类别比例
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.3,random_state=1,stratify=y)

对train_test_split函数中stratify=y的理解：

kind,count=np.unique(y_train,return_counts=True)
print(count)
kind_test,count_test=np.unique(y_test,return_counts=True)
print(count_test)
'''
输出结果：
[35 35 35]
[15 15 15]
'''

1.3 数据标准化

注意标准化本质上是一种线性变换，它并没有改变一个数据在该组数据中的位置，也没有改变该组数据分布的形状，而只是将该组数据变成平均值为0、标准差为1
在这里插入图片描述

from sklearn.preprocessing import StandardScaler

sc = StandardScaler()
## 估算训练数据中的mu和sigma
sc.fit(X_train)
## 使用训练数据中的mu和sigma对数据进行标准化
X_train_std

最低0.47元/天解锁文章