多个逻辑回归二分类器实现minist手写数字识别（Python 仅使用numpy实现）

最新推荐文章于 2025-05-09 12:35:29 发布

原创

最新推荐文章于 2025-05-09 12:35:29 发布 · 2.3k 阅读

35 ·

CC 4.0 BY-SA版权

文章标签：

#python #机器学习 #概率论

该博客通过将多分类问题转化为10个二分类任务，利用Python和numpy实现逻辑回归模型，对手写数字进行识别。每个数字（0-9）训练一个模型，通过Sigmoid激活函数和交叉熵损失函数进行训练，并使用模型输出的概率值进行排序，选取最高概率对应的数字作为识别结果。文章还提供了完整的代码实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

多分类问题可以转换为多个二分类问题，例如，需要完成对手写数字的十分类时，可以采用依次对每个数字（0-9）进行二分类的方式，最终对每次分类中计算出的正样本概率值进行排序，选择概率最高的数字作为分类的结果。

整个过程需要训练10个分类模型（0-9这十个数字每个数字训练一个分类模型），若模型的输入为数字x，则分别使用这10个模型对x进行分类，对每次分类的逻辑回归输出值（即正样本的概率）进行排序，取最大的值所对应的标签作为最终的分类结果。

首先，采用Sigmoid函数作为逻辑回归的激活函数：

代码实现如下：

def logistic(X):
    if(X>=0):
        return 1.0 / (1.0 + np.exp(-X))
    else:
        return np.exp(X)/(1.0 + np.exp(X))

采用交叉熵作为损失函数，在二分类下，交叉熵损失函数如下：

代码实现如下：

def cross_entropy(Y, P):
    Y = np.float_(Y)
    P = np.float_(P)
    return -np.sum(Y * np.log(P + 1e-10) + (1 - Y) * np.log(1 - P + 1e-10))

L对权重w的偏导数为：（logistic - y）* x , 其中logistic为前向传播经过Sigmoid函数激活后的值，其范围在0到1之间。

L对偏置b的偏导数为：（logistic - y）

故在反向传播中，参数w和b的更新如下：

def backward(w,b,data,y,logistic,l_rate):
    for i in range(len(w)):
        w[i] -= l_rate * (logistic - y)*data[i]
    b -= l_rate * (logistic - y)
    return (w,b)

其中l_rate为学习率

模型的训练过程如下（每个训练样本更新一次权重，每个epoch执行一次评估）：

de

最低0.47元/天解锁文章

200万优质内容无限畅学