- 实验目的与要求
- 掌握基于 K-近邻分类算法的编程方法
- 通过编程理解 K-近邻分类算法和该算法的基本步骤
- 实验器材
- 硬件:PC 机(参与实验的学生每人一台)
- 软件环境:Python3.7 + Pycharm
- 实验内容
- 使用 sklearn 库中的 neighbors 模块实现 K-近邻算法,并对二手房样本所
属类别进行预测,程序流程为:
(1) 导入 sklearn 库中的 K-近邻算法模块(KNeighborsClassifier),数据集分割模块(train_test_split)以及机器学习准确率评估模块(metrics)
(2) 读取数据,并分割成特征属性集和类别集
(3) 将数据集分割成训练集和测试集
(4) 构建模型
(5) 利用循环语句,k 值取 1-8 分别训练模型以确定最优 k 值
(6) 使用最优 k 值训练模型并对新样本[7,27]和[2,4]的类别进行预测
(7) 使用测试集对模型进行测试
(8) 预测新样本类别
(9) 绘制分类边界图
- 数据集下载
本实验的数据集可以点击此处去下载
- 代码实现
import numpy as np
import matplotlib.pyplot as plt
from sklearn.neighbors import KNeighborsClassifier
from sklearn import metrics
from sklearn.model_selection import train_test_split
from sklearn.model_selection import cross_val_score
X1,y1=[],[]
fr = open('./knn.txt')
for line in fr.readlines():
lineArr = line.strip().split()
X1