Python-机器学习(二)-K近邻算法的原理与鸢尾花数据集实现详解

文章介绍了使用K-近邻(KNN)算法对鸢尾花数据集进行预测,通过实例展示了如何训练模型、预测结果以及寻找最佳K值的过程。作者还分享了Python学习资源,包括学习路线、视频、项目和电子书,以帮助Python开发者提升技能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

把预测点与距离最近的5个样本连成线

for i in neighbors[1][0]:

plt.plot([x[i][0], x_sample[0][0]], [x[i][1],x_sample[0][1]], ‘k–’, linewidth=0.6)

plt.show()

鸢尾花数据集


  • Iris 鸢尾花数据集内包含 3 类分别为山鸢尾、虹膜锦葵、变色鸢尾,共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:萼片长度、萼片宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于哪一品种。

rom sklearn.datasets import load_iris

iris=load_iris()

iris_data=iris.data

iris_data

#获取样本标记值

iris_target = iris.target

iris_target

##target是一个数组,存储了data中每条记录属于哪一类鸢尾植物,

##所以数组的长度是150

##划分训练集和测试集

x_train,x_test,y_train,y_test= train_test_split(iris_data,iris_target,test_size=0.25)

训一下

knn = KNeighborsClassifier(n_neighbors=5)

knn.fit(x_train,y_train)

y_predict = knn.predict(x_test)

##展示一下预测结果

labels=[‘山鸢尾’,‘虹膜锦葵’,‘变色鸢尾’]

for i in range(len(y_predict)):

print(“第%d次测试:真实值是%s,预测值是%s” % ((i+1),label

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值