PRML笔记：1-介绍

最新推荐文章于 2019-11-09 18:05:34 发布

AIvin24

最新推荐文章于 2019-11-09 18:05:34 发布

阅读量3k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签： PRML

本文链接：https://blog.youkuaiyun.com/AIvin24/article/details/9717295

机器学习专栏收录该内容

5 篇文章

订阅专栏

本文是PRML读书笔记的第一部分，介绍机器学习的基础概念，如训练集、学习过程、预处理、监督学习和非监督学习。通过多项式拟合的例子，探讨了模型的生成能力、过拟合及其解决方案，如正则化，并从概率、决策和信息论三个角度理解模型选择和优化问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

打算去读PRML这本书，用两遍来读完，第一遍弄懂基本思想，以便看其他任何相关文献能够明白他们在说什么；第二遍细看，重点要做书后面的习题，弄清每个知识点的细节部分。第二遍可能不会连续，甚至会挑选部分章节重点研究，但是第一遍需要坚持。近期的博文就是记录自己看到的关键知识概念，到时碰到不懂的时候，再去google查找进一步的解析。行文都依照原作者书中介绍的顺序，希望这些概念能够将整体知识串接起来……

------------------分割线----------------------

训练集（training set）：用来训练模型的观察数据{ $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ }，有的时候会带上目标向量 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ ；

训练（training）或者学习（learning）：寻找一个最优函数 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ ，使其能够与 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ 尽可能接近。

有时需要对数据进行预处理（preprocessed），比如一幅图像有很多像素点组成，我们不需要将这些数据全部输入模型，而是先进行一个特征提取的工作（feature extraction），这是计算机视觉领域一个很重要的工作。同样，新的需要被预测的数据也要进行同样的预处理工作。

当训练好一个模型后，这个模型预测新的数据的能力就称为生成能力（generalization），当 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ 为离散值的时候，称为分类问题（classification），如果是连续值，就是回归问题（regression）。在训练学习过程中，有 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ 值就称为监督学习（supervised learning），如果没有就是非监督学习（unsupervised learning），前面提到的分类、回归问题就属于监督学习范畴，非监督学习包括聚类（clustering）、数据概率分布估计（density estimation）等。

增强学习（reinforcement learning）大概就是在学习阶段去发现一些误差，当前采取的措施需要经过若干步的认证（这个没有弄明白，后续再来解释吧）

在机器学习、模式识别中，需要应用到概率论、决策论、信息论的知识。

实例：多项式拟合

假设目前有N个训练数据 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ 和相应的观察值 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ ，这些数据其实是函数 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ 生成的，我们的目的就是用多项式拟合去逼近这个真实函数。所以假设我们的多项式为

$PRML笔记：1-介绍 - AIvin24 - 知行文亭$

那么我们需要确定合适的系数 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ 来使 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ 近似于 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ ，一个直观想法就是建立一个误差标准

$PRML笔记：1-介绍 - AIvin24 - 知行文亭$

找到是这个误差函数最小的系数 $PRML笔记：1-介绍 - AIvin24 - 知行文亭$ ，就确定了多项式的形式，也就确定好了模型。

事实上，多项式的阶数M需要我们多次试验去选择一个最合适的，次数太小，拟合不精确，次数太大，会造成过拟合。次数太小，很显然在训练阶段和测试阶段的误差都会很大，而过拟合却是一个别样的现象：在训练数据中的误差会很小，如果次数足够大，甚至为0（这个很容易想象，只要次数大于训练数据数目），但是在测试数据集中，误差会变的相当大，而且系数会变得很大。

解决过拟合有两种方案：

1、在次数不变的情况下，增多训练数据；

2、引入正则项（regularization term）约束系数，所以误差函数（1）可以改成如下：

$PRML笔记：1-介绍 - AIvin24 - 知行文亭$