9、机器学习中的分类任务与性能评估

分类任务与性能评估详解

机器学习中的分类任务与性能评估

一、机器学习项目基础要点

在机器学习项目中,有几个关键的基础要点需要注意:
1. 模型与数据集备份
- 要能够轻松比较新模型与之前的模型,同时,对数据集的每个版本都进行备份。这样,当新数据集损坏(例如,新添加的数据包含大量异常值)时,可以回滚到之前的数据集。而且,有了数据集备份,还能针对任何之前的数据集评估模型。
2. 测试集子集创建
- 可以创建测试集的多个子集,以评估模型在数据特定部分的性能。例如,创建一个仅包含最新数据的子集,或者为特定类型的输入(如内陆地区与沿海地区)创建测试集,这有助于更深入地了解模型的优缺点。
3. 项目建设与部署
- 机器学习涉及大量的基础设施建设,所以第一个机器学习项目可能需要花费大量的精力和时间来构建并部署到生产环境。不过,一旦基础设施就位,从想法到生产的过程会快很多。

实践建议

建议选择一个感兴趣的数据集,尝试从头到尾完成整个机器学习过程。可以从竞赛网站(如 http://kaggle.com/ )开始,这里有可供使用的数据集、明确的目标,还能与他人分享经验。

相关练习

以下是基于住房数据集的一些练习:
1. 尝试使用支持向量机回归器( sklearn.svm.SVR ),使用不同的超参数,如 kernel="linear" (使用不同的 C 超参数值)或 kernel="rbf"

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值