一. 神经网络训练基础概念
神经网络训练是通过调整权重参数,使模型输出逐渐逼近真实值的过程。其核心流程可概括为:
数据输入 → 前向传播 → 损失计算 → 反向传播 → 参数更新

二. 前向传播(Forward Propagation)
2.1 计算过程
输入数据逐层通过神经网络,最终得到预测输出:

其中:
-
ll:层编号
-
WW:权重矩阵
-
bb:偏置项
-
σσ:激活函数
代码示例:手动实现前向传播
Python
import torch
import torch.nn as nn
# 定义3层网络
class SimpleNet(nn.Module):
def __init__(self):
super().__init__()
self.fc1 = nn.Linear(784, 256) # 输入层→隐层
self.fc2 = nn.Linear(256, 10) # 隐层→输出层
self.relu = nn.ReLU()
def forward(self, x):
x = self.relu(self.fc1(x))
x = self.fc2(x)
return x
# 测试
model = SimpleNet()
input_data = torch.randn(64, 784) # batch_size=64
output = model(input_data)
print(output.shape) # torch.Size([64, 10])

最低0.47元/天 解锁文章
1827

被折叠的 条评论
为什么被折叠?



