最近在看机器学习,觉得其中的没有免费午餐定理很有趣。
我看的是周志华老师的西瓜🍉书。
周老师在这样描述“没有免费午餐”定理的。简而言之,就是说,如果某一类学习器在解决某一类问题上比另一类学习器性能好,那么必定存在另外一些问题,使得在处理这些问题上,第二类学习器的性能要比第一类学习器的性能好。好玩吧?问题的关键是,学习器的偏好(假设)能不能和数据体现出来的特征一致。
所以我觉得,把人当作是学习器的话,意思就是说,我们每一个人都是可以有用武之地的,问题的关键在于,自己的特性能否与所在领域的要求相一致,或大体相符。
再来说数据的收集。数据的收集更像是一个人的生活经验知识的积累。一般来说,数据越多,越复杂,学习器就可以相对选得复杂一些,不必太过担心过拟合的问题;数据越少,学习器就取比较简单的比较好,因为数据太少了,稍微复杂一点的模型就有可能把原本不是数据呈现出来的特征给“假设”了,就过拟合了。拿学习写诗来做例子,古人云“熟读唐诗三百首,不会吟诗也会吟”。就是说,数据,在这里是诗歌,收集学习到一定程度,学习器就不需要那么复杂。
你觉得呢?
2020-10-06
最新推荐文章于 2025-12-11 12:02:01 发布
本文探讨了机器学习中的‘没有免费午餐’定理,通过生活经验比喻解释了学习器的选择与数据对应的重要性。作者认为每个人都有其适用领域,关键在于匹配技能和工作需求。数据的多少影响模型复杂度,强调了经验积累和适配性在学习过程中的作用。
746

被折叠的 条评论
为什么被折叠?



