周志华机器学习---详解训练集外误差-学习笔记

机器学习-训练集外误差理解与公式解析

原创

已于 2022-05-12 16:38:05 修改 · 1.7k 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2021-06-08 11:23:47 首次发布

本文详细解读了机器学习中训练集外误差的概念，它表示学习算法在训练集以外样本上的预期误差。通过公式Eote(La|X,f)探讨了其计算方式，涉及指示函数、样本空间概率及假设出现的概率。理解关键在于指示函数的真假判断以及对不同假设和样本的求和过程。适合机器学习初学者深入理解模型泛化能力。

周志华机器学习---详解训练集外误差-学习笔记

一。含义：
- 二。算法如下:
三。公式详解：
四。对式子的理解：

一。含义：

学习算法在训练集之外的所有样本上的误差。

二。算法如下:

在这里插入图片描述

三。公式详解：

用La替代式中的学习算法
Eote(La|X,f): 算法La学得的假设在训练集外的所有样本上的误差的期望。
Ⅱ(h(x)≠f(x))：指示函数，括号里为真就=1,为假就=0
∑h: 对假设的求和。同一算法对于训练集外（测试集）的不同数据产生的不同的假设，每个假设有不同的概率。
∑x∈χ−X：对于样本空间中每一个训练集外的数据都进行右边的
P(x) 即训练数据集中，x出现的概率。
P(h|X, La)即，表示学习算法为La，训练数据集为X下，假设h出现的改了。假设可以理解成一个函数或模型，一个样本到结果(好瓜，坏瓜的映射)。
f(x)表示真实期望的目标函数。

四。对式子的理解：

在这里插入图片描述

Ⅱ(h(x)≠f(x))：表示括号里为真就=1,为假就=0。
所以，若绿框里h(x)≠f(x)，所在括的运算为1，绿色框的取值为P(x)*P(h|x, La)。否则，绿色框的值为0。
红框：表示对x属于样本空间且不属于训练集的时，对于每一个x，对绿框的值求和。
黑框：表示对于h的每一个取值，对红框的值进行求和。

最低0.47元/天解锁文章

博客等级

码龄10年

4
原创

7
点赞

9
收藏

2
粉丝

关注

私信

热门文章

分类专栏

微信

下一篇：: 互联网IT技术获取方法总结

最新评论

gitlab clone invalid path checkout failed
优快云-Ada助手: 非常感谢你的分享，关于“gitlab clone invalid path checkout failed”这个问题，我觉得可以写一篇博客详细介绍解决方法和注意事项，尤其是针对不同操作系统的解决方案进行对比和说明。这样的技术文章对其他用户也会非常有帮助，特别是初学者。下一篇你可以继续就“版本控制系统常见问题及解决方案”这个主题继续写，相信会有更多读者受益。加油！为了方便博主创作，提高生产力，优快云上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.youkuaiyun.com/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.youkuaiyun.com/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

大家在看

最新文章

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。