在机器学习中,超参数是模型训练过程中需要提前设定的参数,不会通过模型训练自动调整。以下是一些常见的超参数:
-
学习率 (Learning Rate):
- 决定每次更新模型参数时的步长。学习率过大会导致模型在最优值附近震荡,学习率过小则会导致收敛速度过慢。
-
批量大小 (Batch Size):
- 在一次迭代中使用的训练样本数量。小批量可以减少内存占用,但可能导致训练时间较长;大批量可以提高训练效率,但需要更多的内存。
-
迭代次数 (Number of Epochs):
- 完整训练集被训练的次数。过多的迭代次数可能导致过拟合,过少的迭代次数可能导致欠拟合。
-
正则化参数 (Regularization Parameter):
- 用于控制模型复杂度,防止过拟合。常见的正则化方法包括L1正则化和L2正则化。
-
隐藏层数及神经元数量 (Number of Hidden Layers and Neurons):
- 决定神经网络的结构。更多的隐藏层和神经元可以提升模型的表达能力,但也增加了计算复杂度和过拟合的风险。
-
激活函数 (Activation Function):
- 决定每个神经元输出的形式。常见的激活函数有ReLU、Sigmoid和Tanh。
-
优化器 (Optimizer):
- 用于调整模型参数以最小化损失函数。常见的优化器有SGD、Ad