9、机器学习中的性能评估与参数模型学习

flink9streamer

于 2025-09-15 09:18:15 发布

阅读量15

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习入门精讲文章标签：机器学习性能评估参数建模

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/flink9streamer/article/details/152446717

机器学习入门精讲专栏收录该内容

27 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习中的性能评估与参数模型学习

1. 性能评估与阈值调整

在机器学习模型评估中，我们常常遇到这样的情况：大部分验证数据点能被正确预测为正常，但有相当一部分异常数据会被错误地预测为正常。例如，在某个应用中，准确率（1 - 误分类率）为 0.931，F1 分数为 0.106 ，而一个总是预测正常的无用预测器准确率为 0.927，F1 分数为 0。

为了改善这种情况，我们可以调整决策阈值。以公式（3.36）为例，将决策阈值降低到 r = 0.15 ，即当预测的类别概率超过这个值（g(x) > 0.15）时，我们就预测为正（异常）类。这样做会得到一个新的混淆矩阵：
| | y = normal | y = abnormal |
| — | — | — |
| by = normal | 3067 | 165 |
| by = abnormal | 111 | 85 |

这种改变增加了真正例的数量（从 13 个正确预测为异常的患者增加到 85 个），但同时也增加了假正例的数量（从 1 个错误预测为异常的患者增加到 111 个）。正如预期的那样，准确率下降到 0.919，但 F1 分数提高到 0.381。需要注意的是，F1 分数只考虑了不平衡性，而没有考虑不对称性。我们需要根据哪种类型的错误后果更严重，来判断这个分类器在假阴性率和假阳性率之间的权衡是否合适。

2. 参数建模原理

2.1 非线性参数函数

我们从回归模型 y = fθ(x) + ε 开始讨论。在第 3 章中，为了将其转化为可以使用最小二乘法进行训练且有闭式解的线性回归模型，我们做了两个假设：一是函数 fθ 在模型

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。