YOLO11推理参数

一、推理参数

参考原网址:Predict - Ultralytics YOLO Docs

 model.predict() 接受多个参数,这些参数可以在推理时进行调整:

from ultralytics import YOLO

# 加载预训练的 YOLO11n 模型
model = YOLO("yolo11m.pt")

# 使用参数对 'bus.jpg' 运行推理
model.predict("bus.jpg", show=True, imgsz=640, conf=0.7)
推理参数表
参数类型默认值描述
sourcestr'ultralytics/assets'指定用于推理的数据源。可以是实时源的图像路径、视频文件、目录、URL 或设备 ID。支持多种格式和源,支持跨不同类型的输入灵活应用。
conffloat0.25设置检测的最小置信度阈值。如果检测到的置信度低于此阈值,则将忽略该对象。调整此值有助于减少误报。
ioufloat0.7非最大抑制 (NMS) 的交并比 (IoU) 阈值。值越低,就会消除重叠框,从而减少检测次数,这对于减少重复项非常有用。
imgszint or tuple640定义用于推理的图像大小。可以是单个整数 640 (用于平方调整大小)或 (height, width) 元组。适当的尺寸可以提高检测精度和处理速度。
halfboolFalse启用半精度 (FP16) 推理,这可以加快受支持 GPU 上的模型推理速度,同时对准确性的影响最小。
devicestrNone指定要进行推理的设备(例如 cpu、cuda:0 或 0)。允许用户在 CPU、特定 GPU 或其他计算设备之间进行选择以执行模型。
batchint1指定推理的批量大小(仅当源是目录、视频文件或 .txt 文件时有效)。较大的批处理大小可以提供更高的吞吐量,从而缩短推理所需的总时间。
max_detint300每张图像允许的最大检测数。限制模型在单个推理中可以检测到的对象总数,从而防止在密集场景中出现过多的输出。
vid_strideint1视频输入的帧步幅。允许跳过视频中的帧,以牺牲时间分辨率为代价来加快处理速度。值为 1 时,将处理每个帧,值越高,则跳过帧。
stream_bufferboolFalse确定是否对视频流的传入帧进行排队。如果为 False,则丢弃旧帧以容纳新帧(针对实时应用程序进行了优化)。如果为“True”,则在缓冲区中对新帧进行排队,确保不会跳过任何帧,但如果推理 FPS 低于流 FPS,则会导致延迟。
visualizeboolFalse在推理期间激活模型特征的可视化,从而深入了解模型“看到”的内容。用于调试和模型解释。
augmentboolFalse启用用于预测的测试时增强 (TTA),从而可能以牺牲推理速度为代价提高检测稳健性。
agnostic_nmsboolFalse启用与类无关的非极大值抑制 (NMS),它合并不同类的重叠框。在类重叠很常见的多类检测方案中很有用。
classeslist[int]None将预测筛选为一组类 ID。将仅返回属于指定类的检测。对于在多类检测任务中关注相关对象非常有用。
retina_masksboolFalse返回高分辨率分割掩码。如果启用,则返回的掩码 (masks.data) 将与原始图像大小匹配。如果禁用,则它们具有推理期间使用的图像大小。
embedlist[int]None指定要从中提取特征向量或嵌入的图层。对于聚类分析或相似性搜索等下游任务非常有用。
projectstrNone如果启用了 save,则保存预测输出的项目目录的名称。
namestrNone预测运行的名称。用于在项目文件夹中创建子目录,如果启用保存,则预测输出将存储在该目录中。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

可视化参数表
参数类型默认值描述
showboolFalse如果为 True,则在窗口中显示带注释的图像或视频。在开发或测试期间提供即时视觉反馈。
saveboolFalse or TrueTrue 允许将带注释的图像或视频保存到文件中。可用于记录、进一步分析或共享结果。使用CLI时默认为True,在Python中使用时默认为False。
save_framesboolFalse处理视频时,将单个帧保存为图像。可用于提取特定帧或进行详细的逐帧分析。
save_txtboolFalse将检测结果保存在文本文件中,格式为 [class] [x_center] [y_center] [width] [height] [confidence]( [类] [x_center] [y_center] [宽度] [高度] [置信度])。可用于与其他分析工具集成。
save_confboolFalse在保存的文本文件中包括置信度分数。增强了可用于后处理和分析的细节。
save_cropboolFalse保存检测的裁剪图像。可用于数据集扩充、分析或为特定对象创建专用数据集。
show_labelsboolTrue在视觉输出中显示每个检测的标签。提供对检测到的对象的即时了解。
show_confboolTrue在标签旁边显示每个检测的置信度分数。深入了解模型对每次检测的确定性。
show_boxesboolTrue在检测到的对象周围绘制边界框。对于图像或视频帧中对象的视觉识别和定位至关重要。
line_widthNone or intNone指定边界框的线宽。如果为 None,则根据图像大小自动调整线宽。提供视觉自定义以提高清晰度。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值