35、深度神经网络训练技巧与优化器解析

最新推荐文章于 2025-12-20 20:51:22 发布

五行擒拿术

最新推荐文章于 2025-12-20 20:51:22 发布

阅读量16

点赞数

CC 4.0 BY-SA版权

分类专栏：动手学AI：从零到精通文章标签：迁移学习无监督预训练辅助任务预训练

本文链接：https://blog.youkuaiyun.com/table/article/details/152288510

动手学AI：从零到精通专栏收录该内容

77 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深度神经网络训练技巧与优化器解析

1. 迁移学习的适用性

迁移学习在小而密集的网络中效果不佳，可能是因为小网络学习的模式较少，而密集网络学习的模式非常特定，不太可能在其他任务中发挥作用。迁移学习在深度卷积神经网络中效果最佳，这类网络倾向于学习更通用的特征检测器（尤其是在较低层）。

2. 无监督预训练

2.1 场景与方法

当你要处理一个复杂任务，但标记的训练数据不多，且找不到在类似任务上训练过的模型时，可尝试无监督预训练。通常，收集未标记的训练数据成本较低，但标记它们成本较高。若能收集大量未标记的训练数据，可使用这些数据训练无监督模型，如自编码器或生成对抗网络（GAN）。然后，重用自编码器的较低层或GAN判别器的较低层，在顶部添加针对你任务的输出层，并使用监督学习（即使用标记的训练示例）对最终网络进行微调。

2.2 发展历程

2006年，Geoffrey Hinton及其团队使用了这种技术，这导致了神经网络的复兴和深度学习的成功。直到2010年，无监督预训练（通常使用受限玻尔兹曼机RBM）是深度网络的常态。在缓解梯度消失问题后，仅使用监督学习训练深度神经网络变得更为常见。如今，当你有复杂任务要解决，没有可重用的类似模型，标记的训练数据少但未标记的训练数据多时，无监督预训练（通常使用自编码器或GAN而非RBM）仍然是一个不错的选择。