吴恩达机器学习笔记 LearningNotes of ML-Andrew Ng

芒果奶昔666

已于 2024-03-09 10:05:47 修改

阅读量117

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习笔记 tensorflow

于 2024-03-08 00:32:33 首次发布

原文链接：https://www.bilibili.com/video/BV16C4y197St?p=68&vd_source=4f2b58104fa5749d56fe6331d741c931

机器学习专栏收录该内容

1 篇文章

订阅专栏

本文详细介绍了吴恩达机器学习笔记中关于TensorFlow的实现，包括训练细节、常用激活函数（如ReLU和Softmax）、多分类问题的处理、优化方法（如Adam算法）以及额外的层类型（如卷积层）。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

TensorFlow Implementation

TF实现训练神经网络的基本框架

Training Details

在这里插入图片描述
不同模型编译时使用的loss functions:
线性回归：model.compile( loss = MeanSquaredError())
逻辑回归: model.compile(loss = BinaryCrossentropy())

神经网络训练的标准：使用反向传播的算法(Tensorflow中通过fit一步自动实现)

Multiclassification多分类问题

手写数字识别0-9
在这里插入图片描述

Softmax 函数

softmax层参数计算关系
softmax函数（多分类）其实是sigmoid函数（二分类）的推广

Softmax output in neural network:

各层神经网络计算关系

Softmax输出而言的独特属性: 每个输出值a_j都依赖于z_j从(j=1, 2, 3…10)的所有值
Sparse Categorical Crossentropy: 稀疏范畴交叉熵函数，
稀疏范畴：指依然将y进行分类；
稀疏：输出值y只能从y_j(j = 1, 2, 3…10)中选一个

代码搭建
有何需要改进地方？见下一目录

Improved implementation of softmax

对于softmax等复杂函数的计算，通过先指定（赋值）中间变量再代入，从而给予Tensorflow更多的灵活性，可以更加accurate, 降低产生的误差。
如，在下图实现逻辑回归时：
不推荐：model.compile(loss = BinaryCrossEntropy())
推荐用：model.compile(loss = BinaryCrossEntropy(from_logits=True))
如此，TF将z作为中间值，通过重新排列带入更精确的参数计算，缩小numerical round off errrors
在这里插入图片描述
同理，计算sigmoid函数的loss function时

进行多分类问题时，最后输出层的激活函数应使用线性：For multiclass classification, the recommended way to implement softmax regression is to set from_logits=True in the loss function, and also to define the model’s output layer with a ‘linear’ activation.
代码框架搭建
逻辑回归代码搭建

Classification with multiple outputs:

多分类，多输出经典案例-自动驾驶识别障碍物
解决方法;构造一次输出三个结果的神经网络

Advanced Optimization

梯度下降算法很好，然而有一些其他的算法在最小化cost function方面做得更好。
Adam 算法：自动调整学习速率。对模型的每个参数使用不同的学习速率。
梯度下降：最小化代价函数的基本思路
Adam 算法：自动调整学习率（艾尔法）
在这里插入图片描述
下图引入Adam算法的compile代码中，learning_rate代表初始学习率：

Additional Layer Types

迄今为止，本课程介绍的神经网络层都是密集型的(Dense Layer)，即一层中的每个神经元输入来自于上一层的所有activations（输出）
在这里插入图片描述
对比：卷积层(Convolutional Layer): 每个神经元只负责（接受处理）前一层中输出的部分数据
优点：方便快速计算，需要的训练数据更少；更不容易达到过拟合；