- 操作系统:ubuntu22.04
- IDE:Visual Studio Code
- 编程语言:C++11
算法描述
目标检测(Object Detection)、图像分类(Image Classification)、语义分割(Semantic Segmentation) 是计算机视觉三大核心任务,它们在输入、输出、应用场景和算法思路上有本质区别。
下面我用通俗语言 + 技术对比 + 应用举例 + 输出形式图示的方式,帮你彻底搞懂它们的区别。
一句话通俗理解
| 任务 | 一句话解释 |
|---|---|
| 图像分类 | “这张图里是什么?” → 输出一个标签(如“猫”) |
| 目标检测 | “这张图里有什么,在哪?” → 输出多个框 + 标签(如“猫在左上角”) |
| 语义分割 | “这张图里每个像素属于什么?” → 输出每个像素的类别(精细到像素级) |
技术对比表
| 维度 | 图像分类 | 目标检测 | 语义分割 |
|---|---|---|---|
| 输入 | 一张图像 | 一张图像 | 一张图像 |
| 输出 | 1 |

最低0.47元/天 解锁文章
2531

被折叠的 条评论
为什么被折叠?



