6.2 构造核（PRML读书笔记）

最新推荐文章于 2019-10-17 02:42:11 发布

原创最新推荐文章于 2019-10-17 02:42:11 发布 · 692 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#核方法

机器学习同时被 2 个专栏收录

12 篇文章

订阅专栏

PRML读书笔记

12 篇文章

订阅专栏

本文探讨了核函数的三种构造方法：通过特征空间映射、直接构造并验证其合法性、及从概率生成式模型出发。详细讲解了如何利用特征映射和多项式、指数函数等构造合法核函数，并介绍了核函数的合法性验证方法——半正定性。

为了利⽤核替换，我们需要能够构造合法的核函数。有如下几种方法：
第⼀种⽅法是选择⼀个特征空间映射 $ϕ(x)\phi(\textbf{x})$ ，然后使⽤这个映射寻找对应的核。按此方法⼀维空间的核函数被定义为
在这里插入图片描述
第二种⽅法是直接构造核函数。必须确保核函数是合法的，即它对应于某个（可能是⽆穷维）特征空间的标量积。
确保函数是核函数有如下几种方法：

函数能分解成 $ϕ(x)Tϕ(x′）\phi(\textbf{x})^T\phi(\textbf{x}^{'}）$ 的形式
例如

其中 $ϕ(x)=（x12,2x1x2,x22）T\phi(\textbf{x})=（x_1^2, \sqrt2x_1x_2,x_2^2）^T$
由此可见 $(xTz)2(\textbf{x}^T\textbf{z})^2$ 是一个合法的核函数
更⼀般地，我们需要找到⼀种更简单的⽅法检验⼀个函数是否是⼀个合法的核函数。 $k(x,x′)k(\textbf{x},\textbf{x}^{'})$ 是⼀个合法的核函数的充要条件是Gram矩阵（元素由 $k(xn,xm)k(\textbf{x}_n,\textbf{x}_m)$ 给出）在所有的集合 ${xn}\{\textbf{x}_n\}$ 的选择下都是半正定的（半正定未必可逆，但是6.1节明明需要可逆。再想想看，6.1下未必一定要可逆）
构造新的核函数的⼀个强⼤的⽅法是使⽤简单的核函数作为基本的模块来构造。可以使⽤下⾯的性质来完成这件事。给定合法的核 $k1(x,x′)k_1(\textbf{x},\textbf{x}^{'})$ 和 $k2(x,x′)k_2(\textbf{x},\textbf{x}^{'})$ ，下⾯的新核也是合法的

其中 $c > 0$ 是⼀个常数， $f (\cdot)$ 是任意函数， $q (\cdot)$ 是⼀个系数⾮负的多项式， $ϕ(x)\phi(\textbf{x})$ 是⼀个从x到 $R^M$ 的函数， $k_3(·,·)$ 是 $R^M$ 中的⼀个合法的核， A是⼀个对称半正定矩阵， $xa\textbf{x}_a$ 和 $xb\textbf{x}_b$ 是变量（未必相交），且 $x=(xa;xb)\textbf{x} = (\textbf{x}_a; \textbf{x}_b)$ 。

第三种方法是从⼀个概率⽣成式模型开始构造。
给定⼀个⽣成式模型p(x)，我们可以定义⼀个核
在这里插入图片描述
可以把它看成由映射 $p(x)p(\textbf{x})$ 定义的⼀维特征空间中的⼀个内积。它表明，如果两个输⼊x和 $x′\textbf{x}^{'}$ 都具有较⾼的概率，那么它们就是相似的。
使⽤公式（6.13）和公式（6.17）扩展这类核，比如扩展为不同概率分布的乘积的加和，带有正的权值系数 $p (i)$ ，形式为
在这里插入图片描述
这个核就等价于⼀个混合概率密度。如果两个输⼊x和 $x′\textbf{x}^{'}$ 在很多不同分量下都有较⼤的概率，那么这两个输⼊将会使核函数输出较⼤的值，因此就表现出相似性。
在⽆限求和的极限情况下，我们也可以考虑下⾯形式的核函数
在这里插入图片描述