使用mmdetection测试图片

本文介绍了使用mmdetection工具箱进行目标检测的步骤,包括克隆项目、下载预训练模型、创建测试文件夹和编写test.py脚本。通过这些步骤,作者成功测试了一张图片并展示了结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本人刚入门目标检测,发现了一个开源的工具箱mmdetection,便自己使用里面的模型试着测试一张图片,网上大多数博客写的还是不够详细,所以想自己写一篇,方便大家及自己今后可以回顾。

首先,mmdetection的安装就不用多说了,网上有很多。

1、克隆mmdetection到自己的文件夹中(安装mmdetection时已经克隆就不需要在克隆了),

在终端服务器中输入

git clone https://github.com/open-mmlab/mmdetection

cd mmdetection

2、下载已经训练好的训练模型。

https://github.com/open-mmlab/mmdetection/blob/master/docs/MODEL_ZOO.md

本人下载的是faster_rcnn_r101_fpn_1x_20181129-d1468807.pth

在mmdetection中创建models文件夹,将其放入其中

3、在mmdetection中在mmdetection中创建mycode文件夹,再在mycode下创建test文件夹,新建test.py

#coding=utf-8

from mmdet.apis import init_detector
from mmdet.apis import inference_detector
from mmdet.apis import show_result

# 模型
### 使用 MMDetection 框架进行物体检测 #### 安装环境准备 为了能够顺利运行 MMDetection,需要准备好相应的开发环境。这通常涉及到 Python 版本的选择以及依赖库的安装。推荐使用 Anaconda 来管理虚拟环境,这样可以更方便地处理不同项目之间的包冲突问题[^1]。 ```bash conda create -n openmmlab python=3.8 -y conda activate openmmlab ``` 接着按照官方文档中的指导完成 PyTorch 及其扩展 CUDA 工具链的配置,确保 GPU 加速功能可用。 #### 下载并设置 MMDetection 获取最新版本的 MMDetection 仓库后,依据说明编译必要的 C++ 和 CUDA 扩展模块: ```bash git clone https://github.com/open-mmlab/mmdetection.git cd mmdetection pip install -r requirements/build.txt pip install -v -e . ``` 上述命令会下载源码并且将其作为可编辑模式安装到当前环境中,使得任何本地修改都能即时生效而无需重新打包发布。 #### 准备数据集 对于大多数预训练模型而言,默认支持 COCO 或 Pascal VOC 等标准格式的数据集。如果打算采用其他自定义格式,则需参照模板调整标注文件结构以便于后续加载器读取。这里以 COCO 数据集为例展示基本流程: - 解压原始图片压缩包至指定路径; - 将 JSON 类型的实例分割描述放置在同一目录下; - 修改 `configs/default_runtime.py` 中关于 dataset 的设定项指向实际存储位置; #### 配置文件解读与定制化 MMDetection 提供了大量的基础架构和算法实现,通过 YAML/Python 样式的配置脚本来控制具体的实验参数。用户可以根据需求挑选合适的 backbone (如 ResNet, Swin Transformer),neck 组件(FPN), head 结构(RetinaHead)等构建完整的探测流水线。 例如,在 `configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py` 文件里定义了一个基于 Faster R-CNN 架构的经典两阶段目标识别方案。可以通过继承此模板来创建新的配置文件,并针对特定应用场景做适当简化或增强操作。 #### 训练过程概览 启动训练之前建议先验证单步前向传播是否正常工作(`tools/misc/check_dataset.py`),确认无误后再执行正式迭代优化程序。下面给出了一条简单的调用指令用于启动多卡分布式训练作业: ```bash python tools/train.py configs/my_custom_config.py --gpus 4 ``` 该命令指定了要使用的GPU数量及对应的配置文件名。整个过程中日志会被记录下来帮助监控进度状况,同时 TensorBoard 插件也集成进来便于可视化分析损失变化趋势和其他重要指标表现。 #### 测试评估性能 当一轮或多轮次训练完成后,可通过如下方式快速获得最佳权重保存点上的预测精度统计报告: ```bash python tools/test.py configs/my_custom_config.py work_dirs/my_custom_exp/latest.pth --eval bbox segm ``` 这条语句告诉系统利用已有的 checkpoint 对测试集合实施推理计算,并输出 bounding box 和 mask IoU 值给定类别下的平均得分情况。除此之外还允许导出详细的分类错误案例图像辅助进一步诊断改进方向。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值