周志华《机器学习》学习笔记 Ch01绪论

最新推荐文章于 2024-10-03 15:15:14 发布

最新推荐文章于 2024-10-03 15:15:14 发布 · 287 阅读

·

1

·

本文深入浅出地解析了机器学习的基本概念，包括属性空间、特征向量、分类与回归等核心术语，以及监督学习与无监督学习的区别。强调了模型泛化能力和独立同分布假设的重要性，适合初学者构建坚实的基础。

文章目录：

1.1 引言

1.2 基本术语

1.3 假设空间

1.4 归纳偏好

1.5 发展历程

1.6 应用现状

1.7 习题解答

看完了《机器学习实战》，总感觉自己在入门机器学习中还处于似懂非懂阶段。按理说在看西瓜书之前我应该先看一些数学统计相关的书籍，补充基础知识。但想了想，看了的可能很多也不会记得，还不如遇到不懂的便边学边查了。开始学习西瓜书，希望自己能坚持把笔记写下去，加深自己对机器学习的理解。

1.1 引言

机器学习致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。其所研究的主要内容，是关于在计算机上从数据中产生“模型”的算法，即“学习算法”。机器学习是研究关于“学习算法”的学问。通俗来说，我理解为，通过已知数据研究出预测所需的模型，即函数公式，来进行下一步结果的预测。

在本书中用“模型”泛指从数据中学得的结果。有文献用“模型”指全局性结果（例如一颗决策树），而用“模式”指局部性结果（例如一条规则）。

1.2 基本术语

1. 属性张成的空间称为“属性空间”，“样本空间”或“输入空间”。

2. 由于空间中的每个点对应一个坐标向量，因此我们也把一个示例称为一个“特征向量”。

3. 若我们预测的是离散值，例如“好瓜”“坏瓜”，此类学习任务称为“分类”；

若欲预测的是连续值，例如西瓜成熟度0.95，0.37，此类学习任务称为“回归”；

两个类别的“二分类”任务，分为“正类”和“反类”；

涉及多个类别时，则称为“多分类”任务。

4. 学习任务大致划分为两大类：“监督学习”和“无监督学习”，分类和回归是前者的代表，而聚类是后者的代表。

5. 学得模型适用于新样本的能力，称为“泛化”能力。

6. 通常假设样本空间中全体样本服从A个未知"分布" (distribution) Ð ，我们获得的每个样本都是独立
地从这个分布上采样获得的，即"独立同分布" (independent and identically istributed，简称i.i.d.).
1.3 假设空间

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。