
OCR
文章平均质量分 60
ppocr问题和配置
该醒醒了~
这个作者很懒,什么都没留下…
展开
-
训练paddleocr数据集在原有的数据集中加入新标注的数据一起训练(建议收藏)
最后打开PPOCRLabel.py文件运行打开标注工具选择你新旧数据集合在一起的数据集。侧面这里不带勾,这个没关系 ,这是以为你路径不正确,直接往下走就行。如果你在上方文章的第三步结束了,将会生成三个文件和一个文件夹如下。接着你需要将你新标注的图片也要加入到你原来的数据集中,其中crop_img中的图片用来训练文字识别模型,fileState记录图片的打标完成与否,rec_gt为训练文字识别模型的标签。Label为训练文字检测模型的标签,最后的最后 就可以训练了。原创 2025-02-26 10:22:20 · 275 阅读 · 0 评论 -
PaddlePaddle推理模型利用Paddle2ONNX转换成onnx模型
c后面是你配置的det 的yaml文件 -o Global.pretrained_model=后面是你训练后的模型 latest。lobal.save_inference_dir=保存转换后的推理模型位置。params_filename 是结尾是 .pdiparams文件。model_filename 是结尾是 .pdmodel文件。save_file 保存转换后的onnx模型。model_dir 是你训练模型的文件夹。如果看不明白,下方是我的转换命令。rec的转换和上方的det一样。原创 2024-12-17 13:07:29 · 1051 阅读 · 0 评论 -
PPOCR训练后acc为0解决方法
将如下的train和eval部分的batch_size改小点,例如8。如下是rec训练模型 acc为0 det也是如此。首先你需要先配置PPOCR源码和环境,可以按照如下流程。模型文件中会生成best文件,这种就属于没问题的。如下没有 名为best的模型文件。然后再次运行就有了acc了。原创 2024-07-16 13:41:49 · 973 阅读 · 4 评论 -
PaddleOCR训练自己的数据集(中英文)(全套)和C#部署(半套)
PaddleOCR是一个基于飞桨开发的OCR(Optical Character Recognition,光学字符识别)系统。其技术体系包括文字检测、文字识别、文本方向检测和图像处理等模块。以下是其优点:高精度:PaddleOCR采用深度学习算法进行训练,可以在不同场景下实现高精度的文字检测和文字识别。多语种支持:PaddleOCR支持多种语言的文字识别,包括中文、英文、日语、韩语等。同时,它还支持多种不同文字类型的识别,如手写字、印刷体、表格等。原创 2024-06-25 14:23:15 · 2739 阅读 · 0 评论 -
PPOCR训练报错ModuleNotFoundError: No module named ‘ppocr.modeling‘
我的解决 办法是把,你下载的飞桨的PPocr源码版本换成最新版的。然后配置好环境和yaml文件后就可以愉快的训练了。我报错的版本是r2.6 换成main就没问题了。原创 2024-06-19 16:37:05 · 905 阅读 · 0 评论