自己动手实现一个神经网络多分类器

最新推荐文章于 2025-05-15 17:25:11 发布

原创

最新推荐文章于 2025-05-15 17:25:11 发布 · 1.7w 阅读

69 ·

CC 4.0 BY-SA版权

文章标签：

#neural network #classifier

本文介绍了如何不依赖深度学习框架，手动实现一个简单的神经网络多分类器。首先通过生成非线性可分数据，训练Softmax线性分类器，然后探讨了softmax和交叉熵损失在多分类中的作用。接着，作者构建了一个神经网络，显著提高了分类效果，并展示了训练前后决策边界的对比。最后提供了联系方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文由**罗周杨stupidme.me.lzy@gmail.com**原创，转载请注明作者和出处。未经授权，不得用于商业用途。

不使用任何深度学习框架，实现一个简单的神经网络用来分类。
手把手带你搭建神经网络，包括损失函数的选择，已经手写反向传播代码。

生成一些数据

生成一些数据，这些数据不太容易线性分类。

import numpy as np
import matplotlib.pyplot as plt

N = 100 # 每一个类别的生成的点的数量
D = 2 # 每个点的维度，这里使用平面，所以是2维数据
K = 3 # 类别数量，我们一共生成3个类别的点

# 所有的样本数据，一共300个点，每个点用2个维度表示
# 所有训练数据就是一个300*2的二维矩阵
X = np.zeros((N*K, D))
# 标签数据，一共是300个点，每个点对应一个类别，
# 所以标签是一个300*1的矩阵
y = np.zeros(N*K, dtype='uint8')

# 生成训练数据
for j in range(K):
    ix = range(N*j, N*(j+1))
    r = np.linspace(0.0, 1, N)
    t = np.linspace(j*4, (j+1)*4, N) + np.random.randn(N)*0.2
    X[ix] = np.c_[r*np.sin(t), r*np.cos(t)]
    y[ix] = j
    
plt.scatter(X[:, 0], X[:, 1], c=y, s=40, cmap=plt.cm.Spectral)
plt.show()

训练一个Softmax线性分类器

使用softmax和cross-entropy loss，训练一个线性分类器。

实际上就是直接用softmax做多分类，使用交叉熵损失作为损失函数，训练一个线性分类模型。

import numpy as np
import matplotlib.pyplot as plt

N = 100
D = 2
K = 3
X = np.zeros((N*K, D))
y = np.zeros(N*K, dtype='uint8')

for j in range(K):
    ix = range(N*j, N*(j+1))
    r = np.linspace(0.0, 1, N)
    t = np.linspace(j*4, (j+1)*4, N) + np.random.randn(N)*0.2
    X[ix] = np.c_[r*np.sin(t), r*np.cos(t)]
    y[ix] = j
    
# plt.scatter(X[:, 0], X[:, 1], c=y, s=40, cmap=plt.cm.Spectral)
# plt.show()

# 初始化权重和偏置
W = 0.01 * np.random.randn(D, K)
b = np.zeros((1, K))

step_size = 1e-0
reg = 1e-3 # regularization strength


# 获取训练样本数量
num_examples = X