自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 PaddleOCRv5训练自己的模型-微调文本检测模型

本文介绍了PaddleOCRv5文本检测模型的微调方法。主要步骤包括:1)数据准备,需按官方格式制作标注数据集;2)模型训练,需修改配置文件中的训练参数和数据集路径;3)模型导出为推理格式;4)可选转换为ONNX格式;5)最后演示了如何调用训练好的模型进行预测。文中详细说明了配置文件各参数含义,并针对大尺寸图片训练、早停等场景给出了解决方案。配套的标注工具PPOCRLABEL使用注意事项可参考作者其他文章。

2025-08-19 11:09:26 1504

原创 PPOCRlabel遇见的坑

文章总结了使用PPOCRLabel标注工具时遇到的四个坑点:1)安装后无响应需手动运行.py文件;2)自动标注后需逐个确认保存;3)多人标注合并时数据丢失问题;4)label.txt文件意外乱码导致工作白费。作者特别强调要定期备份标注数据,以免重复劳动。这些经验教训对使用该工具的用户具有重要参考价值,提醒使用者注意操作细节并做好数据保护。

2025-08-18 20:34:41 469

原创 PaddleOCRv5训练自己的模型-微调文字识别模型

本文介绍了使用PaddleOCR微调文字识别模型的具体步骤。首先需要按照官方格式准备数据集,包括图片和标注文件。然后进行模型训练,包括环境安装、预训练模型下载、配置文件修改等关键环节,特别针对训练中可能出现的类别数不匹配问题提供了三种解决方案。文章还详细说明了模型导出为静态图格式的方法,以及如何调用训练好的模型进行推理。整个过程涉及多个技术细节,如早停机制设置、断点续训方法等,为需要提升OCR识别精度的开发者提供了实用指导。

2025-06-17 11:32:10 2602

原创 目标检测yolo数据处理全流程(网络爬取,视频截取/抽帧,数据标注,txt/xml格式转换)

本文分享了YOLO目标检测项目中最耗时但重要的数据处理工作流程,包含五个关键环节: 1️⃣数据获取:通过摄像头录制或网络爬取视频图片,需注意合法性和数据质量 2️⃣数据处理:视频抽帧/截取技巧,推荐运动检测+抽帧方法,强调人工筛选的重要性 3️⃣数据标注:解决labelimg常见问题,建议使用OVD大模型或迭代标注提高效率 4️⃣数据格式转换:提供VOC转YOLO格式的Python脚本 5️⃣数据集划分:自动划分train/val的代码实现每个环节都配有实用代码片段和注意事项,特别强调数据质量把控和命名

2025-06-13 09:50:54 967 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除