深度学习中的模型训练与HDF5数据集构建
1. 迁移学习与从头训练的选择
在深度学习中,我们常常面临是使用迁移学习还是从头开始训练模型的抉择。这一决策主要取决于两个关键因素:
- 数据集的大小。
- 数据集与预训练卷积神经网络(通常在ImageNet上训练)所使用的数据集的相似度。
基于这两个因素,我们可以构建一个表格来辅助决策:
| 数据集情况 | 与原数据集相似度 | 建议策略 |
| — | — | — |
| 小 | 相似 | 将预训练网络作为特征提取器,提取较深网络层的特征,并在这些特征上训练简单的机器学习分类器。 |
| 大 | 相似 | 进行微调,因为预训练网络中的滤波器可能已经具有足够的判别能力。 |
| 小 | 不同 | 应用特征提取,使用网络的较低层作为特征提取器,并在这些特征上训练标准机器学习模型。 |
| 大 | 不同 | 可以尝试两种方法:先对预训练网络进行微调并评估性能;然后从头开始训练一个全新的模型并评估。建议先尝试微调,以建立一个基准。 |
1.1 数据集小且与原数据集相似
由于数据集较小,可能没有足够的训练示例来从头训练卷积神经网络。理想情况下,每个要识别的类别应该有1000 - 5000个示例。此外,由于训练数据不足,尝试微调可能会导致过拟合。因此,应将预训练网络视为特征提取器,并在这些特征上训练简单的机器学习分类器。提取网络较深层的特征,因为这些特征更丰富,更能代表从原数据集中学习到的模式。
1.2 数据集大且与原数据集相似
有了大量的数据集,我们应该有足够的示例来进行微调而不会过拟合。虽然也可以
超级会员免费看
订阅专栏 解锁全文
511

被折叠的 条评论
为什么被折叠?



