怎么优化深层神经网络（超参、正则以及优化）

原创

已于 2022-08-11 15:20:19 修改 · 395 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#神经网络 #深度学习 #机器学习

于 2022-06-06 14:26:28 首次发布

本文探讨了优化深层神经网络的方法，包括训练集和测试集的划分、偏差与方差的权衡、正则化策略如L2和dropout，以及超参数调试，如学习速率、Momentum、mini-batch大小和隐藏单元数量。强调了正则化和调整超参数在避免过拟合和提高模型性能中的重要性。

在训练神经网络时，我们需要做出很多决策，比如：神经网络分多少层；每层含有多少个隐藏单元；学习速率是多少；各层采用哪些激活函数等等。

我们不可能从一开始就准确的预测出这些超参数，因为应用机器学习是一个高度迭代的过程，通常在项目启动时，我们会先有一个初步的想法，比如构建一个含有特定层数，隐藏单元数量或数据集个数等等的神经网络，然后编码，并尝试运行这些代码，通过运行和测试得到该神经网络或这些配置信息的运行结果，你可能会根据输出结果重新完善自己的想法，改变策略，或者为了找到更好的神经网络不断迭代更新自己的方案。对于很多应用系统，即使是经验丰富的深度学习工作者也不太可能一开始就预设出最匹配的超级参数。