- 博客(1)
- 收藏
- 关注
原创 wav2vec2 训练出现 NaN 的问题及解决方案
摘要:在使用wav2vec2训练时出现NaN问题,原因是Transformers 4.41.2版本参数命名变更导致卷积层被随机初始化。具体表现为新版参数名与检查点参数名不匹配,使得关键权重未被正确加载。解决方案是通过代码手动映射旧参数到新命名格式,并保存修正后的模型。该方法成功解决了因卷积层初始化不当导致的NaN问题,确保模型能正常训练。
2025-12-05 20:37:54
146
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅