【火炉炼AI】机器学习031-KNN回归器模型的构建

本文详细介绍如何使用Python和scikit-learn库构建KNN回归模型,从数据集准备到模型训练,再到预测新数据的过程。并通过图表直观展示模型在训练集及新数据集上的表现。

【火炉炼AI】机器学习031-KNN回归器模型的构建

(本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2 )

在上一篇文章中我们学习了构建KNN分类器模型,但是KNN不仅可以用于分类问题,还可以用于回归问题,本章我们来学习KNN回归模型的构建和训练。


1. 准备数据集

此处我们使用随机函数构建了序列型数据集,其产生方式是用函数np.sinc()来产生y值。

# 准备数据集,此处用随机的方式生成一些样本数据
amplitute=10
num_points=100
dataset_X=amplitute*np.random.rand(num_points,1)-0.5*amplitute
dataset_y=np.sinc(dataset_X).ravel()
dataset_y+=0.2*(0.5-np.random.rand(dataset_y.size))
print(dataset_X.shape)
print(dataset_y.shape)

用plt将该数据集绘制到图表中,可以看到如下结果。

数据集的分布情况


2. KNN回归模型的构建和训练

构建和训练KNN回归器与KNN分类器一样简单,如下代码。

# 构建KNN回归模型
from sklearn.neighbors import KNeighborsRegressor
K=8
KNN_regressor=KNeighborsRegressor(K,weights='distance')
KNN_regressor.fit(dataset_X,dataset_y)

虽然此处构建了KNN回归器并对该回归器进行了训练,可是怎么知道训练结果了?

如下我定义了一个绘图函数,可以用散点图的方式来绘制原始的数据集和预测之后的数据集

# 将回归器绘制到图中
def plot_regressor(regressor, X, y):
    # 将数据集绘制到图表中看看分布情况
    plt.scatter(X,y,color='k',marker='o',label='dataset')
    predicted=regressor.predict(X)
    plt.scatter(dataset_X,predicted,color='blue',marker='*',label='predicted')
    plt.xlim(X.min() - 1, X.max() + 1)
    plt.ylim(y.min() - 0.2, y.max() + 0.2)
    plt.legend()
    plt.show()

在本数据集上的表现可以从下图中看出:

KNN回归器在训练集上的表现

上面可以看出该KNN回归器在训练集上的表现貌似还不错,那么怎么用该训练完成的KNN回归器来预测新数据集了?如下我们先构建一序列新样本数据,然后将该样本数据绘制到图中,看看其分布是否符合原来的分布特性。

# 下面用本KNN回归器来预测新样本数据,如下
# 构建了10倍的新数据,并且建立第二个轴,用于KNNregressor.predict
new_samples=np.linspace(-0.5*amplitute, 0.5*amplitute, 10*num_points)[:, np.newaxis]
new_predicted=KNN_regressor.predict(new_samples)

# 把原始数据也画上来
plt.scatter(dataset_X,dataset_y,color='k',marker='o',label='dataset')
plt.plot(new_samples,new_predicted,color='r',linestyle='-',
         label='new_samples')
plt.legend()

得到的结果图貌似有非常严重的过拟合,如下图:

KNN回归器在新样本数据上的表现

########################小**********结###############################

1,KNN回归器的构建,训练,预测和KNN分类器基本一致。

2,我在使用KNN回归器对训练集进行预测,得到的预测值竟然和训练集中的Y值完全一致,一模一样,我反复检查了好多遍,还是这个结果,刚开始以为是K值太小导致过拟合,但是修改K后仍然有这种情况,这个现象不知道其他人遇到没有,我找了好久都没找到原因所在。

#################################################################


注:本部分代码已经全部上传到(我的github)上,欢迎下载。

参考资料:

1, Python机器学习经典实例,Prateek Joshi著,陶俊杰,陈小莉译

普通文本型 你提到的“机器学习--KNN物体分类”属于人工智能中的分类任务,通常可通过Mind+结合AI扩展或Python环境实现。以下是使用 **Mind+** 完成KNN物体分类的基本思路与步骤: --- ### ✅ 一、理解KNN分类 KNN(K-Nearest Neighbors)是一种基于距离判断类别的算法: 新样本根据其与训练数据中最近K个邻居的类别投票结果进行分类。 公式:两点间欧氏距离为 $$ d = \sqrt{(x_1 - x_2)^2 + (y_1 - y_2)^2} $$ --- ### ✅ 二、在Mind+中实现KNN分类的路径 Mind+本身不直接支持完整KNN训练,但可通过以下方式间接实现: #### 方式1:使用 **Mind+ + Python模式(推荐)** 1. 切换到“Python模式” 2. 导入`scikit-learn`、`numpy`等库 3. 编写KNN代码示例: ```python from sklearn.neighbors import KNeighborsClassifier import numpy as np # 示例数据:颜色特征 [R, G, B] -> 分类为苹果(0) 或 香蕉(1) X = np.array([[255, 0, 0], # 红色苹果 [250, 10, 10], [255, 255, 0], # 黄色香蕉 [240, 240, 10]]) y = np.array([0, 0, 1, 1]) # 训练KNN模型(K=3) knn = KNeighborsClassifier(n_neighbors=3) knn.fit(X, y) # 预测新物体 new_color = [[200, 20, 20]] result = knn.predict(new_color) print("预测类别:", result) ``` > 💡 可结合摄像头获取物体颜色均值作为输入特征。 #### 方式2:使用 **Mind+ + 图像识别扩展** - 添加“图像识别”或“AI视觉”扩展模块 - 调用预训练模型对物体分类(如人脸识别、颜色识别) - 虽非原生KNN,但可用于实际物体分类任务 #### 方式3:模拟KNN逻辑(仅教学演示) 用Mind+积木模拟KNN判断过程: - 输入待分类点坐标 - 计算与已知点的距离 - 找出最近3个点,统计多数类别 - 输出分类结果 --- ### ✅ 三、应用场景举例 - 颜色分类(红/黄/绿物体) - 手写数字识别(配合像素特征) - 水果分类机人(结合传感数据) --- ### 📝 注意事项 - Mind+对复杂机器学习支持有限,建议进阶使用Python IDE。 - 实际KNN需标准化数据,避免某特征主导距离计算。 - K值选择影响结果:K太小易受噪声干扰,K太大可能模糊边界。 --- 如你有具体硬件(如摄像头、传感)或想实现的任务(如识别颜色、形状),可提供细节,我将为你定制完整方案。
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值