knn这个分类器,原理很简单,可以说是机器学习里面最简单的一个分类器。
工作原理:存在一个训练样本集,这些样本集都是有标签,也就是我们知道样本集中每个数据与其类别的对应关系。输入没有标签的新数据后,将新数据与样本集的数据特征进行比较,然后按照特定算法提取样本集中最相似的数据分类标签。举个例子:
电影名称 打斗镜头 接吻镜头 电影类型
california 3 100 爱情片
kevin longbal 101 10 动作片
beautiful 1 80 爱情片
he likes flying 2 100 爱情片
robo slayer 99 5 动作片
ok,大概就举这么多例子,这里有5个电影,给出了两个特征就是打斗镜头和接吻镜

kNN算法是机器学习中最简单的分类器之一。它通过计算新数据与样本集的距离,选取最近的k个样本,依据多数投票原则决定新数据的类别。kNN在处理多分类问题时精度较高,但计算复杂度和空间复杂度也较高。选择合适的k值、距离衡量方式以及应对高维和变量值域差异问题都是使用kNN时需要考虑的关键点。此外,kNN算法无需训练,但对测试样本分类时计算成本较大,可通过压缩样本或利用kd树等提高效率。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



