使用自己定义的色彩方案 ListedColormap 作 plt.scatter() 的参数

该博客通过鸢尾花数据集展示了如何使用Python进行数据加载与预处理,利用matplotlib进行数据可视化,将花萼长度和花萼宽度作为特征,用不同颜色区分三个鸢尾花品种。代码实现了对样本的散点图展示,便于理解数据分布。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考链接: https://blog.youkuaiyun.com/MaxxiChen/article/details/106137315.
这里以鸢尾花数据集为例,

import pandas as pd
import numpy as np
import tensorflow as tf
import matplotlib as mpl
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = "SimHei"
plt.rcParams['axes.unicode_minus'] = False

# 第一步:加载数据
TRAIN_URL = "http://download.tensorflow.org/data/iris_training.csv"
train_path = tf.keras.utils.get_file(TRAIN_URL.split('/')[-1], TRAIN_URL)
df_iris = pd.read_csv(train_path, header=0)  # 表示第一行数据作为列标题

iris = np.array(df_iris)  # 将二维数据表转换为 Numpy 数组, (120, 5), iris的训练集中有120条样本,

# 提取属性和标签
train_x = iris[:, 0:2]  # 我们只取出前两列属性, (120, 2), 花萼的长度和花萼的宽度
train_y = iris[:, 4]  # 取出最后一列作为标签值, (120,)
# 2.4 可视化样本
cm_pt = mpl.colors.ListedColormap(["blue", "red", "green"])
# 取出花萼长度和花萼宽度作为样本点的横坐标和纵坐标, 根据样本点的标签值确定样本的颜色, 设置色彩方案为cm_pt
plt.scatter(train_x[:, 0], train_x[:, 1], c=train_y, cmap=cm_pt)
# 之前的例程中, 我们使用的都是 matplotlib 中预设的色彩方案,这里我们使用自己定义的色彩方案,
# 在散点图中, 蓝色的是山鸢尾, 红色的是变色鸢尾, 绿色的是维吉尼亚鸢尾.
plt.show()

上述代码中,train_y是样本标签值,有三种取值
样本值 0 — blue,
样本值 1 — red,
样本值 2 — green

运行代码,结果如下:
在这里插入图片描述

from sklearn.neighbors import KNeighborsClassifier from sklearn.preprocessing import StandardScaler # 数据预处理(标准化) scaler = StandardScaler() X_train_scaled = scaler.fit_transform(X_train) X_test_scaled = scaler.transform(X_test) # 创建k-NN模型 knn = KNeighborsClassifier( n_neighbors=5, # k值 weights='distance', # 距离加权投票 metric='minkowski', # 距离度量 p=2 # 欧氏距离 (p=1为曼哈顿距离) ) # 训练与预测 knn.fit(X_train_scaled, y_train) accuracy = knn.score(X_test_scaled, y_test) print(f"标准化后准确率: {accuracy:.2%}") # 可视化决策边界(仅使用前两个特征) import matplotlib.pyplot as plt from matplotlib.colors import ListedColormap def plot_decision_boundary(): # 只取前两个特征 X_2d = X_train_scaled[:, :2] y_2d = y_train # 创建网格 h = 0.02 # 网格步长 x_min, x_max = X_2d[:, 0].min() - 1, X_2d[:, 0].max() + 1 y_min, y_max = X_2d[:, 1].min() - 1, X_2d[:, 1].max() + 1 xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h)) # 预测网格点类别 Z = knn.predict(np.c_[xx.ravel(), yy.ravel()]) Z = Z.reshape(xx.shape) # 绘制 cmap_light = ListedColormap(['#FFAAAA', '#AAFFAA', '#AAAAFF']) cmap_bold = ListedColormap(['#FF0000', '#00FF00', '#0000FF']) plt.figure(figsize=(10, 6)) plt.pcolormesh(xx, yy, Z, cmap=cmap_light) # 绘制训练点 plt.scatter(X_2d[:, 0], X_2d[:, 1], c=y_2d, cmap=cmap_bold, edgecolor='k', s=20) plt.xlim(xx.min(), xx.max()) plt.ylim(yy.min(), yy.max()) plt.title(f"k-NN (k={knn.n_neighbors}) 决策边界") plt.xlabel(iris.feature_names[0]) plt.ylabel(iris.feature_names[1]) plt.show() plot_decision_boundary() 补齐代码
最新发布
07-15
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xuechanba

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值