西瓜书《机器学习》课后答案——Chapter1

最新推荐文章于 2025-06-09 22:10:04 发布

Vic时代

最新推荐文章于 2025-06-09 22:10:04 发布

阅读量9.2k

点赞数 11

CC 4.0 BY-SA版权

分类专栏：机器学习

本文链接：https://blog.youkuaiyun.com/VictoriaW/article/details/80314466

本文详细探讨了机器学习中假设空间的概念，通过西瓜书《机器学习》的Chapter1实例分析了版本空间的构建及如何处理包含噪声的数据。归纳偏好在无法找到完全匹配训练数据的假设时起到关键作用，选择最匹配且最简单的假设。此外，文章还讨论了No Free Lunch定理在不同性能度量下的适用性，并阐述了机器学习在互联网搜索中的应用，如关键字映射和搜索结果排序。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.1
请查看西瓜书《机器学习》阅读笔记1——Chapter1_假设空间中列举的所有假设。现在只有西瓜1和西瓜4两个样本：
西瓜1为正例，找到假设空间中和它一致的假设：10，12，14，16，58，60，62，64
西瓜4为反例，找到假设空间中和它一致的假设：23，24，31，32，55，56，63，64
保留西瓜1的结果，去除西瓜4的结果，得到版本空间：10，12，14，16，58，60，62
1.2
待写
1.3若数据包含噪声，则假设空间中有可能不存在与所有训练样本都一致的假设。在此情形下，试设计一种归纳偏好用于假设选择。
解答：
给定训练数据，可能出现假设空间中有多个假设匹配该训练数据的情况（构成版本空间），也可能出现没有假设匹配训练数据的情况。
在第一种情况出现时，需要根据学习算法本身的归纳偏好从版本空间中选择偏好的那个假设。
在第二种情况出现时，还是需要从假设空间中选择一个可能好的假设，可以为学习算法设计这样的归纳偏好：选择最匹配训练数据的假设，也即最好的那个；如果有多个最好的假设，选择最简单的那个假设。

1.4本章在论述No Free Lunch定理时，默认使用了分类错误率作为性能度量来对分类器进行评估。若换用其他性能度量 $l$ ，试证明No Free Lunch定理仍然成立。
解答：

\begin{aligned} (1) & \sum_{f} E_{o t e} (L_{a} | X, f) & = \sum_{f} \sum_{h} \sum_{x \in X - X} P (x) l (h (x), f (x)) P (h | X, L_{a}) \\ (2) & = \sum_{h} \sum_{x \in X - X} P (x) P (h | X, L_{a}) \sum_{f} l (h (x), f (x)) \\ (3) & = \sum_{h} \sum_{x \in X - X} P (x) P (h | X, L_{a}) 2^{| X | - 1} (l (h (x), h (x)) + l (h (x),! h (x))) \end{aligned}

$\begin{align}\sum_fE_{ote}({\cal{L}}_a|X,f) & =\sum_f\sum_h\sum_{x\in {{\cal X}-X}}P(x)l\left(h(x),f(x)\right)P(h|X,{\cal{L}}_a) \\ &=\sum_h\sum_{x\in {{\cal X}-X}}P(x)P(h|X,{\cal{L}}_a)\sum_fl\left(h(x),f(x)\right) \\ &=\sum_h\sum_{x\in {{\cal X}-X}}P(x)P(h|X,{\cal{L}}_a)2^{|{\cal X}|-1}\left(l\left(h(x),h(x)\right)+l\left(h(x),!h(x)\right)\right) \end{align}$
如果NFL定理成立，那么需要

l(h(x),h(x))