人工智能（3）- 模型评估和调参

最新推荐文章于 2025-10-18 11:28:31 发布

原创

最新推荐文章于 2025-10-18 11:28:31 发布 · 1.7k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #机器学习

本文介绍了机器学习中的模型评估方法，包括pipeline、K-折交叉验证、网格搜索调参，以及学习曲线和验证曲线。通过这些工具，可以有效评估模型性能并调整参数以优化模型。同时，讨论了不同的性能指标，如准确率、误分类率、召回率、精确率和F1 Score。

1.pipeline 管道利用

pipeline的概念可以从这里抽象出来：将一件需要重复做的事情切割成各个不同的阶段，每一个阶段由独立的单元负责。所有待执行的对象依次进入作业队列。

管道机智在机器学习中得以应用的根源在于参数集在新的数据及上的重复利用。

2.K-折交叉验证评估模型性能

holdout交叉验证

    holdout交叉验证是机器学习模型泛化性能的一个经典且常用的方法。
    holdout交叉验证能将最初的数据集分为训练集和测试集

    模型选择：对模型的的不同参数设置进行调优和比较的过程，也就是针对给定分类问题，调整参数以寻找最优值（超参）的过程。

    使用holdout进行模型选择更好的方法：将数据划分为三个部分，训练集，测试集，验证集。
训练集：用于不同模型的拟合，模型在验证集上的性能表现作为模型选择的标准

    不使用测试集用于模型训练以及模型选择的优势：
       评估模型应用于新数据上能够获得较小偏差

K折交叉验证(k-fold cross-validation)

首先将所有数据分割成K个子样本，不重复的选取其中一个子样本作为测试集，其他K-1个样本用来训练。共重复K次，平均K次的结果或者使用其它指标，最终得到一个单一估测。

这个方法的优势在于，保证每个子样本都参与训练且都被测试，降低泛化误差。其中，10折交叉验证是最常用的。

3.利用网格搜索调参

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。