目标检测(Object Detection)是计算机视觉中的一项基础任务,旨在识别图像或视频中所有目标物体的位置与类别。换句话说,它回答两个关键问题:
-
图像中有哪些物体?(分类)
-
它们在什么位置?(定位)
例如:给一张街景图,目标检测模型能指出“这里是人”、“那里是汽车”、“那边是交通灯”,并用框框圈出它们的位置。

一、目标检测的输出是什么?
目标检测模型的典型输出如下:
-
类别(如:人、猫、车)
-
置信度(模型预测该类别的概率)
-
边界框(Bounding Box):物体在图像中的矩形坐标
(x, y, width, height)
示例输出:
[
{ 类别: "person", 置信度: 0.98, 边界框: [50, 80, 120, 200] },
{ 类别: "car", 置信度: 0.92, 边界框: [200, 150, 300, 220] },
]
免费分享一套人工智能入门学习资料给大家,如果你想自学,这套资料非常全面!
关注公众号【AI技术星球】发暗号【321C】即可获取!
【人工智能自学路线图(图内推荐资源可点击内附链接直达学习)】
【AI入门必读书籍-花书、西瓜书、动手学深度学习等等...】
【机器学
目标检测:原理、方法与应用

最低0.47元/天 解锁文章
11万+

被折叠的 条评论
为什么被折叠?



