问题简述:我有一组数据,数据量是五百多,维度是30,分类有两种,要使用knn算法对数据进行预测。
一、伪代码
(1)整个过程的伪代码
Begin:
Input: 数据集datasets, k值数组;
Do:
对datasets进行归一化,并将其按照7:3的比例划分成训练集和测试集
利用训练集的数据,根据k折交叉验证,获取最优k值
确定k值后使用knn算法对测试集的数据进行预测
Output: 测试集中各个数据所属的类别。
End
(2)knn算法伪代码
Begin:
Input: 数据集a,待测数据b,k
Do: