旅行模式分类:机器学习与深度学习方法的对比研究
1. 模型参数设置
在后续使用LSTM/Bi - LSTM模型的所有实验中,我们将隐藏节点的数量设置为256。对于学习率,我们在所有实验中使用Adam优化器的默认值0.001。批量大小在所有实验中设置为64。对于训练轮数(epochs),我们尝试通过将其值从25以5为增量变化到40来调整这个参数。
增加训练轮数显然会增加训练时间,因此在表5中我们没有报告训练时间。与上述调优实验类似,我们将序列长度和隐藏节点的数量分别设置为140和256。从表5可以看出,当我们将训练轮数从25改变到40时,准确率变化不大。结合表4中隐藏节点数量设置为256的结果,我们观察到当训练轮数从20增加到30时,验证准确率开始下降。当训练轮数分别设置为35和40时,验证准确率先上升然后再次下降。因此,为了防止过拟合,我们在后续实验中将训练轮数设置为30。
| 数据集 | 隐藏节点数量 | ||||
|---|---|---|---|---|---|
| 100 | 128 | 200 | 256 | 300 | |
| acc | tr_t | acc | tr_t |
超级会员免费看
订阅专栏 解锁全文
1569

被折叠的 条评论
为什么被折叠?



