我们提供了一组在COCO数据集、Kitti数据集、开放图像数据集、avavav2.1数据集和非自然物种检测数据集上预先训练的检测模型。如果您对这些数据集中已经存在的类别感兴趣,那么这些模型对于开箱即用的推理非常有用。在训练新的数据集时,它们对于初始化模型也很有用。
在下表中,我们列出了每个此类预先培训的模型,包括:
- 与samples/configs目录中用于训练此模型的配置文件相对应的模型名,
- 指向tar.gz文件的下载链接,该文件包含预先训练的模型,
- 模型速度——我们报告每600x600图像的运行时间(包括所有预处理和后处理),但请注意,这些计时高度依赖于个人的特定硬件配置(这些计时是使用Nvidia GeForce GTX TITAN X卡执行的),在许多情况下,应更多地视为相对计时。还要注意,桌面GPU计时并不总是反映移动运行时间。例如,Mobilenet V2在移动设备上比Mobilenet V1快,但在桌面GPU上稍慢。
- 在COCO验证集或开放图像测试的子集上的检测器性能被数据集特定的mAP度量所分割。这里,越高越好,我们只报告四舍五入到最近整数的边界框映射。
- 输出类型(框和掩码,如果适用)
您可以通过以下方式取消对每个tar.gz文件的tar:
tar -xzvf ssd_mobilenet_v1_coco.tar.gz
在解压目录中,您会发现:
- 图形原型(graph.pbtxt)
- 检查点(model.ckpt.data-00000-of-00001,model.ckpt.index,model.ckpt.meta)
- 一个冻结图原型,其权重作为常量烘焙到图中(frozen_inference_graph.pb),用于开箱即用的推理(在Jupyter笔记本中试试!)
- 用于生成图形的配置文件(pipeline.config)。它们直接对应于samples/configs)目录中的配置文件,但通常具有修改的分数阈值。对于更重更快的R-CNN模型,我们还提供了一个模型版本,该模型使用了大量的速度建议。
- 仅限移动模型:可在移动设备上部署的TfLite文件(model.TfLite)。
关于冻结推理图的一些注记:
- 如果您尝试评估冻结的图表,您可能会发现某些模型的性能数字略低于下表中的报告。这是因为我们在创建冻结图时丢弃分数低于阈值(通常为0.3)的检测。这有效地对应于在检测器的精确召回曲线上选择一个点(并丢弃超过该点的部分),这会对标准映射度量产生负面影响。
- 我们的冻结推理图是使用Tensorflow的v1.12.0版本生成的,我们不保证这些版本可以与其他版本一起使用;也就是说,通过重新运行导出程序,可以使用Tensorflow的当前版本重新生成每个冻结推理图,指向模型目录以及samples/configs中相应的配置文件。
COCO-trained models
注:型号名称末尾的星号(☆)表示该型号支持TPU培训。
注:如果您下载了量化模型的tar.gz文件和untar文件,您将得到不同的文件集-检查点、配置文件和tflite冻结图(txt/binary)。
Mobile models
| Model name | Pixel 1 Latency (ms) | COCO mAP | Outputs |
|---|---|---|---|
| ssd_mobilenet_v3_large_coco | 119 | 22.6 | Boxes |
| ssd_mobilenet_v3_small_coco | 43 | 15.4 | Boxes |
Pixel4 Edge TPU models
| Model name | Pixel 4 Edge TPU Latency (ms) | COCO mAP | Outputs |
|---|---|---|---|
| ssd_mobilenet_edgetpu_coco | 6.6 | 24.3 | Boxes |
Kitti-trained models
| Model name | Speed (ms) | Pascal mAP@0.5 | Outputs |
|---|---|---|---|
| faster_rcnn_resnet101_kitti | 79 | 87 | Boxes |
Open Images-trained models
| Model name | Speed (ms) | Open Images mAP@0.52 | Outputs |
|---|---|---|---|
| faster_rcnn_inception_resnet_v2_atrous_oidv2 | 727 | 37 | Boxes |
| faster_rcnn_inception_resnet_v2_atrous_lowproposals_oidv2 | 347 | Boxes | |
| facessd_mobilenet_v2_quantized_open_image_v4 3 | 20 | 73 (faces) | Boxes |
| Model name | Speed (ms) | Open Images mAP@0.54 | Outputs |
|---|---|---|---|
| faster_rcnn_inception_resnet_v2_atrous_oidv4 | 425 | 54 | Boxes |
| ssd_mobilenetv2_oidv4 | 89 | 36 | Boxes |
| ssd_resnet_101_fpn_oidv4 | 237 | 38 | Boxes |
iNaturalist Species-trained models
| Model name | Speed (ms) | Pascal mAP@0.5 | Outputs |
|---|---|---|---|
| faster_rcnn_resnet101_fgvc | 395 | 58 | Boxes |
| faster_rcnn_resnet50_fgvc | 366 | 55 | Boxes |
AVA v2.1 trained models
| Model name | Speed (ms) | Pascal mAP@0.5 | Outputs |
|---|---|---|---|
| faster_rcnn_resnet101_ava_v2.1 | 93 | 11 | Boxes |
本文介绍了在多个数据集上预先训练的一系列目标检测模型,包括COCO、Kitti、开放图像等。这些模型适用于开箱即用的推理和模型初始化,详细列出了模型名称、速度、性能指标及输出类型。
6万+

被折叠的 条评论
为什么被折叠?



