KNN分类器的python实现

KNN分类器

监督学习
knn:通过样本和样本之间的距离来进行分类
样本属于临近样本中大多数样本的归属类

  • 1.基于python 设计knn分类器
  • 2.数据获取:txt、csv、xlsx
  • 3.测试算法
  • 4.使用算法
    注: 若是各特征之间的数据级差距过大,将会影响分类效果,所以分类之前要进行数据处理
1. knn核心算法(python)
## knn.py
import numpy as np
import operator


def knn(X, dataSet, label, k):
## 分类器:knn分类算法的python实现
## X:一待分类样本的特征集;dataSet:模型的训练集;k:k类
    diff = np.tile(X, (dataSet.shape[0], 1)) - dataSet
    d = (diff**2).sum(axis=1)**0.5
    sortd1 = d.argsort()
    classCount = {
   }
    for i in range(k):
        votell = label[sortd1[i]]
        classCount[votell] = classCount.get(votell, 0)+1
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)
    return sortedClassCount[0][0]
2. 数据归一化
## normalization.py
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值