《机器学习》-- 周志华（第一章学习笔记）

最新推荐文章于 2025-02-26 21:56:42 发布

原创

最新推荐文章于 2025-02-26 21:56:42 发布 · 2.9k 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #预测

绪论

基本术语

分类（classification）：若我们欲预测的是离散值，如“好瓜”“坏瓜”，此类学习任务成为“分类”。
回归（regression）：若预测的是连续值，如西瓜成熟度0.65，0.78，此类学习任务称为“回归”。
聚类（clustering）：将训练集分成若干组（簇），这些簇可能对应一些潜在的概念划分，如“浅色瓜”“深色瓜”。
学习（learning）/训练（training）：从数据中学得模型的过程。
训练数据：训练过程中使用的数据。
训练集：训练样本组成的集合。
真相/真实：关于数据的某种潜在规律自身。学习过程就是为了找出或逼近真相。
根据训练数据是否有标记信息，学习任务可分为：监督学习和无监督学习。分类、回归是监督学习，聚类是非监督学习。
泛化能力：学得模型适用于新样本的能力。
归纳偏好：机器学习算法在学习过程中对某种类型假设的偏好，如算法喜欢“好瓜<->（色泽=青绿）^（根蒂=蜷缩）^（敲声=浊响）”。注：任何一个有效的学习算法必有其归纳偏好，否则它将被假设空间中假设所迷惑。

没有免费的午餐

No Free Lunch Theoren 定理，
没有免费的午餐定理，简称NFL定理，
由美国斯坦福大学的Wolpert和Macready教授提出。

在机器学习算法中的体现为在没有实际背景下，
没有一种算法比随机胡猜的效果好。

首先，我们假设一个算法为a，
而随机胡猜的算法为b，
为了简单起见，
假设样本空间为χ和假设空间为H都是离散的。
令 P(h|X,a)表示算法a基于训练数据X产生假设h的概率，
再令f代表我们希望的真实目标函数。
a的训练集外误差，即a 在训练集之外的所有样本上的误差为

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。