【机器学习笔记】Machine Learning Fundamentals: Cross Validation(交叉验证)

本文介绍了交叉验证在机器学习中的重要性,通过比较不同方法如逻辑回归、最近邻算法、支持向量机等,展示如何利用交叉验证选择最佳模型。强调了交叉验证不拘泥于特定的训练和测试数据划分,常见的十折交叉验证法及其在参数调整中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先我们有一组医疗数据,以有无心脏疾病为标准记录各个患者的特征。

然后给出一名新患者的特征信息,判断他是否得心脏疾病。

接着我们要选出一种最合适的机器学习方法。然而方法有许多种,包括logistics regression(逻辑回归)、K-nearest neighbors(最近邻算法)、support vector machine(支持向量机、SVM)等等,我们该如何从中挑选?

Cross Validation(交叉验证)允许我们比较不同的机器学习方法,并且认识到它们在实践中的表现。

 

对于上述中收集到的医疗数据,我们需要做两件事情:

  • 估算机器学习方法需要使用的参数(在机器学习的术语中被称为“算法训练(Training the Algorithm)”)
  • 评估机器学习方法的工作成果(在机器学习的术语中被称为“算法测试(Testing the Algorithm)”)

换句话说,我们需要将源数据集划分为两个部分,一

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值