PaddleOCR训练文字识别模型时遇到an evaluation is run every 2000 iterations后程序不运行直接结束

最新推荐文章于 2024-12-01 21:53:26 发布

原创最新推荐文章于 2024-12-01 21:53:26 发布 · 1.8k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#paddle #python

在训练PaddleOCR的rec模块时，遇到程序异常结束的问题。经过排查，发现是由于evaldataset中无图像导致的评估禁用，并且通过调整Global配置中的max_text_length参数至1000以适应文本长度，最终解决了训练中断的故障。

昨日训练PaddleOCR的文字识别模块(rec)时遇到了如下输出后程序直接结束

ppocr INFO: load pretrain successful from D:\PaddleOCR-train\trains\ResNet\ResNet34_vd_pretrained
[2023/05/20 08:42:37] ppocr INFO: No Images in eval dataset, evaluation during training will be disabled
[2023/05/20 08:42:37] ppocr INFO: During the training process, after the 1e+111th iteration, an evaluation is run every 2000 iterations

最开始排查了各种设置包括将yum中Train的batch_size_per_card和num_workers调小，最后运行结果依然如此。

最后在github上的一篇lssues中发现需要修改Global中的max_text_length，将其调整致1000，使实际文本长度<max_text_length设置的长度

问题解决了

源文章：https://github.com/PaddlePaddle/PaddleOCR/issues/9681