
目标检测
文章平均质量分 69
CV-deeplearning
曾任小米AI Lab图像算法工程师, 现任国内知名公司算法专家, 微信公众号:AIWorkshopLab。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
MonkeyOCR从理论到实践——保姆级教程
MonkeyOCR:本文提出“结构-识别-关系”(SRR)三元组范式,实现了高效且精准的文档解析。其3B参数模型在英文文档解析任务中超越了Gemini 2.5 Pro和Qwen2.5-VL-72B。在对多页文档解析场景下,处理速度达每秒0.84页,显著优于MinerU(0.65页/秒)和Qwen2.5-VL-7B(0.12页/秒)。原创 2025-06-12 14:25:25 · 1137 阅读 · 1 评论 -
DocLayout-YOLO使用指南
DocLayout-YOLO是一个基于YOLOv10的文档布局分析工具,可自动检测文档中的标题、正文、表格、公式等元素。通过pip安装后,用户可调用封装好的Python类进行预测,返回检测框坐标、类别和置信度。该工具支持GPU加速,在测试中展现了良好的检测效果,能准确识别文档中的各类结构元素。项目提供在线体验、论文和开源代码,方便研究人员和开发者使用。原创 2025-06-11 11:21:22 · 277 阅读 · 0 评论 -
CPNDet:Corner Proposal Network for Anchor-free, Two-stage Object Detection(论文阅读)
无锚点两阶段目标检测的角点建议网络,实现了精度和速度的最好平衡。《Corner Proposal Network for Anchor-free,Two-stage Object Detection》阅读笔记原创 2020-07-31 17:36:43 · 1644 阅读 · 0 评论 -
YOLO V5 实战
YOLO V5开源了,还是pytorch版本的,对于pytorch使用者而言就非常友好,本文作者用车辆数据集跑了一下yolo v5, 效果还是非常不错的,和大家一起分享。原创 2020-07-25 18:03:27 · 4510 阅读 · 4 评论 -
mmdectionv1 SSD-mobilenetv2实战
本工程主要讲解在mmdetv1 中集成SSD mobilenetv2 算法,并且在PASCAL VOC上的测试指标超过了原论文。原创 2020-06-15 09:56:57 · 1617 阅读 · 0 评论