机器学习模型评估与选择

1 模型评估

在数据量充足情况下,对比不同算法,通常采用如下步骤:
1)将数据集分成训练、验证、测试三部分子数据集;
2)训练和验证两个子数据集随机变换,训练模型;对得到的模型用验证数据验证,得到验证误差;
3)选择验证误差最小的那个模型作为最终模型,这个模型就是我们要选择的最佳模型;
4)用最佳模型去跑测试数据集,即可得到该模型的预测误差。不同算法的预测效果就从该预测误差体现出来。

2 模型选择与交付

模型选择是这样的,先计算模型对验证数据的验证误差,然后取验证误差最小的那个模型。注意,在拆分训练、验证、测试三部分子数据集时要随机划分。
最后,模型交付给用户,需要用得到的模型在全部数据集上再训练一遍,因为 这样才能充分利用已有数据,即已有经验。

3 模型(算法)性能对比

这里写图片描述

3.1 t检验

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

4 分类的性能度量

分类任务中,主要用错误率和精度来衡量算法的好坏。
错误率是指分类错误的样本数占样本总数的比例。
精度是指分类正确的样本数占样本总数的比例。

5 混淆矩阵

如有150个样本数据,这些数据分成3类,每类50个。分类结束后得到的混淆矩阵为:

这里写图片描述
每一行之和为50,表示50个样本,
第一行说明类1的50个样本有43个分类正确,5个错分为类2,2个错分为类3

这里写图片描述

数据集介绍:多等级水果成熟度检测目标检测数据集 数据集名称:多等级水果成熟度检测目标检测数据集 数据规模: - 训练集:1,753张图片 - 验证集:504张图片 - 测试集:250张图片 分类类别: G1-G3成熟度等级的8种热带水果: - 苹果(APPLE) - 香蕉(BANANA) - 葡萄(GRAPE) - 番石榴(GUAVA) - 芒果(MANGO) - 橙子(ORANGE) - 石榴(POMOGRANATE) - 西瓜(WATERMELON) 标注格式:YOLO格式,包含目标检测所需的中心坐标和边界框尺寸 农业自动化分拣系统: 支持开发水果成熟度自动分拣设备,通过视觉检测实现G1(未成熟)、G2(成熟中)、G3(完熟)等级自动分类。 智能农业机器人: 为果园采摘机器人提供视觉识别能力,准确识别不同成熟度的水果并规划采摘策略。 农产品质量监控: 构建水果供应链质量检测系统,实时评估农产品新鲜度和存储适宜性。 农业科研领域: 为农业AI法研究提供基准数据集,支持目标检测模型在复杂农业场景下的性能优化。 成熟度分级精准: 每个水果类别均包含G1-G3三个成熟度等级标注,支持细粒度检测模型开发。 热带水果全覆盖: 涵盖8种主要热带经济作物,满足全球热带农业产区的技术需求。 真实场景多样性: 包含不同光照条件、果实密度和背景环境下的图像,增强模型鲁棒性。 工业适配性强: YOLO格式标注兼容主流检测框架,可直接应用于农业自动化设备的视觉模块开发。 标注质量可靠: 边界框精准覆盖果实主体,有效排除枝叶遮挡等干扰因素,确保检测准确性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值