Coursera机器学习-Week 5-测验:Neural Networks: Learning

最新推荐文章于 2025-02-03 21:52:26 发布

原创最新推荐文章于 2025-02-03 21:52:26 发布 · 1.9k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#Coursera #机器学习

机器学习专栏收录该内容

10 篇文章

订阅专栏

本文探讨了神经网络训练过程中的关键优化技巧，包括梯度检查、正则化参数调整、初始化策略等，帮助读者理解如何有效避免过拟合、欠拟合等问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1

描述

这里写图片描述

解析

根据题目给定的公式大胆的猜 $\Delta_{ij}^{(k)} := \Delta_{ij}^{(k)} + \delta_i^{(k + 1)} * (a^{(k)})_j$ ，所以题目选择 $D$ 。

2

描述

这里写图片描述

解析

因为 $Theta1$ 包含 $15$ 个元素、 $Theta2$ 包含 $24$ 个元素，所以按照 $thetaVec = [Theta1(:); Theta2(:)]$ 组合时，会得到一个包含 $39$ 个元素的 $thetaVec$ 向量，想要重新获取 $Theta2$ 需要将后 $24$ 个拆分出来构造成 $4 * 6$ 的 $Theta2$ ，所以选 $A$ ，注意下标是从 $1$ 开始。

3

描述

这里写图片描述

解析

将 $\theta = 1$ 和 $\epsilon = 0.01$ 代入 $\frac{J(\theta + \epsilon) - J(\theta - \epsilon)}{2\epsilon}$ 得， $ans = 12.0012$ ，选 $D$ 。

4

描述

这里写图片描述

解析

$A$ ，使用梯度检测的确可以帮助减少反向传播算法计算时的 $Bug$ ，正确；
$B$ ，神经网络过拟合时，可以尝试将 $\lambda$ 变大，毕竟神经网络的损失函数和正则修正操作都是从梯度下降算法中引申过来的，所以原理可借鉴，正确；
$C$ ，两者公式原理相似，都可以用梯度检测，错误；
$D$ ，当 $\lambda$ 过大时会出现欠拟合，参照梯度下降算法，错误。

5

描述

这里写图片描述

解析

$A$ 不能全部设置为 $0$ 或者 $1$ ，这样会因为参数相同而没有什么效果，错误；
$B$ 参照 $A$ ，不能全部设置为相同的值，推荐的是全部随机成接近于 $0$ 的浮点数，错误；
$C$ 只能趋向于局部最小值，初始值不同，结果也可能会不同，正确；
$D$ 参照梯度下降算法，随着迭代的增加，应该逐渐变小，正确。