有的训练是需要十几小时到几天的时间,最后阶段崩溃退出,没有见过的错误会让人相当恼火
1. 确定哪一部分数据最有可能导致问题;
2. 单独对这部分数据进行训练,以加快速度重现;
本文介绍了一种快速定位并解决机器学习训练过程中出现崩溃问题的方法,通过隔离可疑数据集部分来加速错误重现。
有的训练是需要十几小时到几天的时间,最后阶段崩溃退出,没有见过的错误会让人相当恼火
1. 确定哪一部分数据最有可能导致问题;
2. 单独对这部分数据进行训练,以加快速度重现;

被折叠的 条评论
为什么被折叠?