斯坦福大学CS231课程笔记1

最新推荐文章于 2025-10-16 10:25:45 发布

原创最新推荐文章于 2025-10-16 10:25:45 发布 · 3.3k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#神经网络 #正则 #学习率 #dropout

深度学习同时被 3 个专栏收录

67 篇文章

订阅专栏

机器学习

40 篇文章

订阅专栏

计算机视觉

10 篇文章

订阅专栏

本文介绍了从简单的线性回归逐步过渡到复杂的神经网络的过程，涵盖了Mini-batch SGD、正向传播、反向传播等核心概念，并深入讨论了批量正则化（Batch Normalization）、激活函数的选择、学习率调整策略以及优化方法如Adam和RMSProp等内容。

从线性回归到神经网络

Mini-batchSGD

正向传播计算loss反向传播计算梯度，根据梯度更新参数

图的拓扑排序正向和反向

class ComputationalGraph(object):
   def forward(inputs):
   # 1.[pass inputs to input gates...]
   # 2.forward the computational graph:
    for gate in self.graph.nodes_topologically_sorted():
      gate.forward()
    return loss #the final gate in the graph outputs the loss
   def backward():
    for gate in reversed(self.graph.nodes_topologically_sorted()):
      gate.backward() #little piece of backprop (chain rule applied)
    return inputs_gradients