K近邻算法3 识别手写数字 from机器学习实战

这篇博客通过一个实例展示了如何运用K近邻(KNN)算法识别手写数字,详细介绍了处理过程,包括将图像转换为向量以及批量导入文件创建训练集和测试集。最终实现的算法错误率为1.06%,并提出了改进计算效率的思路。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

补档最后一个例子

识别手写数字
前面KNN算法已经写好了,这个栗子也没有用到归一化处理
我们的数据集、测试集是3232的文本文档,用0/1表示
文件名0-1.txt代表数字0的第一个数据,因此可以通过字符串切片来获得label标签
处理有两部分:
1.将图像格式化处理为一个向量
把32
32的向量变成1*1024

'''
    来解决手写识别系统部分
    把32*32处理成1*1024的向量
'''
def getfile2(filename):
    returnVect = np.zeros((1,1024))
    fr=open(filename)
    for i in range(32):
        linestr = fr.readline()
        for j in range(32):
            returnVect[0,i*32+j]=int(linestr[j])
    return returnVect

2.将大批量的文件导入,形成np.matrix类型的训练集和测试集
这里用到了os模块中的listdir函数,作用是获得该目录下的所有的文件名

from os import listdir

总体的代码如下

import numpy as np
import matplotlib.pyplot as plt
import operator
from os import listdir

'''
K近邻算法实现
inX:用于分类的向量
dataSet数据集
labels标签
k 就是取前K个
'''


def calssify0(inX, dataSet, labe
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值