机器学习-白板推导-系列（七）笔记：核函数

最新推荐文章于 2022-11-24 13:59:22 发布

流动的风与雪

最新推荐文章于 2022-11-24 13:59:22 发布

阅读量984

点赞数 1

分类专栏：机器学习文章标签：核函数内积完备空间希尔伯特空间

本文链接：https://blog.youkuaiyun.com/qq_40061206/article/details/113270412

版权

机器学习专栏收录该内容

20 篇文章

订阅专栏

本文深入探讨了处理非线性可分问题的核方法，通过Cover定理阐述了将问题映射到高维空间的必要性。详细介绍了正定核函数的两个定义及其性质，并解释了其在希尔伯特空间中的作用。此外，还讨论了核函数的实用性和避免维数灾难的能力，以及在机器学习算法中的应用，如Kernel SVM。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

0 笔记说明

来源于【机器学习】【白板推导系列】【合集 1～23】，我在学习时会跟着up主一起在纸上推导，博客内容为对笔记的二次书面整理，根据自身学习需要，我可能会增加必要内容。

注意：本笔记主要是为了方便自己日后复习学习，而且确实是本人亲手一个字一个公式手打，如果遇到复杂公式，由于未学习LaTeX，我会上传手写图片代替（手机相机可能会拍的不太清楚，但是我会尽可能使内容完整可见），因此我将博客标记为【原创】，若您觉得不妥可以私信我，我会根据您的回复判断是否将博客设置为仅自己可见或其他，谢谢！

本博客为（系列七）的笔记，对应的视频是：【(系列七) 核方法1-背景介绍】、【(系列七) 核方法2-正定核-两个定义】、【(系列七) 核方法3-正定核-必要性证明】。

下面开始即为正文。

有三个概念：① 思想角度上：核方法（Kernel Method）；② 计算角度上：核技巧（Kernel Trick）；③ 核函数（Kernel Function）。

1 背景介绍

现实中的问题大多是非线性可分的。举个栗子，线性可分是这样的——比如一条笔直的河将两岸的事物一分为二，这样的话，这条笔直的河作为一个“超平面”就将事物分为两类了。但是现实中没有哪条河是笔直不曲的，再举个其他的栗子——区域划分就是非线性可分的，每个省之间不是由一条直线就分开了的，是由一条弯弯曲曲的线隔开的。可以这样理解，若样本集可由一条直线直接划分为两类的就是线性可分问题，其他情况就是非线性可分问题。

1.1 Cover定理

怎么处理非线性可分问题呢？可以将低维的样本集转换到高维空间，转换后的样本集就有可能是线性可分的了。Cover定理：将复杂分类问题非线性地映射到高维空间将比映射到低维空间更可能是线性可分的。

下面举个栗子。

1.2 异或问题

对于异或问题，设集合D={0,1}，输入空间为X={(0,0),(1,1),(0,1),(1,0)}，显然输入空间是二维的，在坐标轴上表示为：
在这里插入图片描述
输入空间X中有四个点。对于异或问题，x₁与x₂相同为0不同为1，因此X中前两个点的值为0（图中用o表示），后两个点的值为1（图中用×表示）。显然没有一条直线可以解决异或问题的分类。

现在做这样的处理：对于输入空间中的任一点(x₁,x₂)，转换为(x₁,x₂,(x₁-x₂)²)，称转换后的空间为特征空间，记为Z，则Z={(0,0,0),(1,1,0),(0,1,1),(1,0,1)}。显然特征空间是三维的，在坐标轴上表示为：
在这里插入图片描述
特征空间Z中有四个点，前两个点的值为0（图中用o表示），均在底平面；后两个点的值为1（图中用×表示），均在顶平面。显然，任意一个在底平面和顶平面之间的平面可以解决异或问题的分类。

2 正定核

2.1 核函数

设集合X为输入空间，其中每个样本均是n维的。从X中任意取两个样本x与z，即x、z∈Rⁿ。K是一个将X×X映射到R上的映射，即K：X×X→R，称K(x,z)为核函数。

2.2 正定核函数

不说明的情况下，核函数指的就是正定核函数。什么是正定核函数呢？有两种定义，如下：

2.2.1 定义1

若存在希尔伯特空间（【3 希尔伯特空间】一节中会解释）中的某个非线性映射φ，φ实现了从输入空间X到特征空间Z的映射，其中Z∈R^m，m远大于n，即n<<m。若有K(x,z)=<φ(x),φ(z)>，其中<φ(x),φ(z)>表示φ(x)与φ(z)的内积运算，即K(x,z)=φ(x)^Tφ(z)，则称K(x,z)为正定核函数。