最近在 MOOC 上学习北理工的模式识别课程,这里记录下学习笔记。
1、样本、特征与特征空间
- 样本:一个个具体要识别的事物称为样本。
- 特征:从样本中抽取能够识别这个样本的关键特性,称为样本的一个特征,例如 4 个轮子是汽车的一个重要特征。
- 特征空间:当我们找到一组特征来表达一个样本后,就完成了样本到特征表达之间的数学转换,所有样本转换完后构成的特征表达就是特征空间。
在特征空间中,每个样本都可以看做是由一组特征来表达的一个点,通过抽取样本的特征,并转换成数学表达,就将原事物(样本)的识别问题转换为:对该样本在特征空间中对应点的进行分类。
2、向量空间、集合空间
- 向量空间:如果样本的一个特征可以抽象成向量的一个维度,那么一个样本的多个特征就可以抽象成向量空间的一个向量,即特征向量。
- 集合空间:如果样本的特征不能用向量空间来表达,则可以构成集合空间。
3、有监督、无监督学习
模式识别技术的核心其实是一个分类器,要实现一个好的分类器,关键是确定一个好的分类决策规则,即设计一个好的分类器模型或模式识别算法,以及确定要抽取的用于分类的样本特征。
我们经常听到的训练,学习的意思是:在已经确定分类器模型和样本特征的前提下,通过算法来处理大量训练数据来找到最优参数的过程。
那什么是有监督学习呢?有监督的意思是存在人工干预,比如人为的给一个样本加上小狗的标签,另一个样本加上小猫的标签,然后让分类器分别在这两个样本上训练,训练完成后给定两个样本之一,分类器能够识别样本图片中是小狗还是小猫。
模式识别基础:北理工MOOC学习笔记

本文是北理工MOOC模式识别课程的学习笔记,涵盖了样本与特征、向量空间、有监督与无监督学习、紧致性、泛化能力等核心概念,以及模式识别系统的六个步骤。探讨了如何从数据中抽取出有效特征,构建分类器,并避免过拟合,以提升泛化能力。
最低0.47元/天 解锁文章
1204

被折叠的 条评论
为什么被折叠?



