torchvision库中已存在目标检测的相应模型,只需要调用相应的函数即可。
1. 单文件:
## 导入相关模块
import numpy as np
import torchvision
import torch
import torchvision.transforms as transforms
from PIL import Image, ImageDraw, ImageFont
import matplotlib.pyplot as plt
model = torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=True)
model.eval()
## 准备需要检测的图像
image = Image.open("/mnt/COCO2017/val2017/000000000285.jpg")
transform_d = transforms.Compose([transforms.ToTensor()])
image_t = transform_d(image) ## 对图像进行变换
pred = model([image_t]) ## 将模型作用到图像上
print(pred)
## 定义使用COCO数据集对应的每类的名称
"""
fire hydrant 消防栓,stop sign 停车标志, parking meter 停车收费器, bench 长椅。
zebra 斑马, giraffe 长颈鹿, handbag 手提包, suitcase 手提箱, frisbee (游戏用)飞盘(flying disc)。
skis 滑雪板(ski的复数),snowboard 滑雪板(ski是单板滑雪,snowboarding 是双板滑雪。)
kite 风筝, baseball bat 棒球棍, baseball glove 棒球手套, skateboard 滑板, surfboard 冲浪板, tennis racket 网球拍。
broccoli 西蓝花,donut甜甜圈,炸面圈(doughnut,空心的油炸面包), cake 蛋糕、饼, couch 长沙发(靠chi)。
potted plant 盆栽植物。 dining table 餐桌。 laptop 笔记本电脑,remote 遥控器(=remote control),
cell phone 移动电话(=mobile phone)(cellular 细胞的、蜂窝状的), oven 烤炉、烤箱。 toaster 烤面包器(toast 烤面包片)
sink 洗碗池, refrigerator 冰箱。(=fridge), scissor剪刀(see, zer), teddy bear 泰迪熊。 hair drier 吹风机。
toothbrush 牙刷。
"""
COCO_INSTANCE_CATEGORY_NAMES = [
'__BACKGROUND__', 'person', 'bicycle', 'car', 'motorcycle',
'airplane', 'bus', 'train', 'trunk', 'boat', 'traffic light',
'fire hydrant', 'N/A', 'stop sign', 'parking meter', 'bench',
'bird', 'cat', 'dog', 'horse', 'sheep', 'cow', 'elephant',
'bear', 'zebra', 'giraffe', 'N/A', 'backpack', 'umbrella', 'N/A',
'N/A', 'handbag', 'tie', 'suitcase', 'frisbee', 'skis', 'snowboard',
'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard',
'surfboard', 'tennis racket', 'bottle', 'N/A', 'wine glass',
'cup', 'fork', 'knife', 'spoon',

这篇博客介绍了如何利用torchvision库在PyTorch中实现目标检测。作者通过单文件操作并针对COCO2017数据集随机选取10个文件进行测试,展示了模型能够识别出如人、摩托、棒球手套等物体,但也存在一定的误识别情况,如将马桶误识别为马桶和杯子。文中还提到了可以对模型进行调优,并引用了《PyTorch深度学习入门与实践》作为参考书籍。
最低0.47元/天 解锁文章
2272





