一、图像分类的三层境界
1. 通用多类别图像分类
最基础的分类任务,例如:
- CIFAR-10 数据集:飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船、卡车
- 目标是将图像正确划分到已知类别中
2. 子类细粒度图像分类
在大类下区分更精细的子类别,如:
- 不同品种的花
- 不同型号的手机
- 要求模型捕捉更细微的特征差异
3. 实例级图像分类
识别具体的个体,如:
- 人脸识别
- 特定车辆识别
- 不仅要知道 "是什么",还要知道 "是谁"
二、核心评估指标
混淆矩阵基础
- TP(真正例):正类预测为正类
- FP(假正例):反类预测为正类
- TN(真反例):反类预测为反类
- FN(假反例):正类预测为反类
常用评估指标
- 精确率 (Accuracy):模型识别正确的样本数 / 总样本数
- 准确率 (Precision):预测为正类的样本中,真正为正类的比例
- 召回率 (Recall):正确识别的正类样本占总正类样本的比例
- F1-Score:精确率和召回率的调和平均数
可视化评估
- P-R 曲线:召回率增加时精确率变化趋势
- ROC 曲线:不同阈值下的分类性能
- 多类别混淆

最低0.47元/天 解锁文章
687

被折叠的 条评论
为什么被折叠?



