声明:
1. 转载自《统计学习方法》
核函数
定义
设χχ是输入空间(欧式空间RnRn的子集或离散集合,又设HH为特征空间(希尔伯特空间),如果存在一个从到HH的映射
使得对所有x,z∈χx,z∈χ,函数K(x,z)=ϕ(x)⋅ϕ(z)K(x,z)=ϕ(x)⋅ϕ(z),则称K(x,z)K(x,z)为核函数,ϕ(x)ϕ(x)为映射函数,式中ϕ(x)⋅ϕ(z)ϕ(x)⋅ϕ(z)为ϕ(x)ϕ(x)和ϕ(z)ϕ(z)的内积。
核技巧的想法是,在学习与预测中只定义核函数K(x,z)K(x,z),而不显示地定义映射函数ϕϕ。通常,直接计算K(x,z)K(x,z)会比较容易,而通过ϕ(x)ϕ(x)和ϕ(z)ϕ(z)计算K(x,z)K(x,z)并不容易。
示例
假设输入空间是R2R2,核函数是K(x,z)=(x,z)2K(x,z)=(x,z)2,是找出相关的特征空间HH和映射。
解:
取特征空间H=R3H=R3,记x=(x(1),x(2))Tx=(x(1),x(2))T,z=(z(1),z(2))Tz=(z(1),z(2))T,
由于(x⋅z)2=(x(1)z(1)+x(2)z(2))2=(x(1)z(1))2+2x(1)z(1)x(2)z(2)+(x(2)z(2))2(x⋅z)2=(x(1)z(1)+x(2)z(2))2=(x(1)z(1))2+2x(1)z(1)x(2)z(2)+(x(2)z(2))2,
所以可取映射ϕ(x)=((x(1))2,2‾√x(1)x(2),(x(2))2)ϕ(x)=((x(1))2,2x(1)x(2),(x(2))2)。
容易验证ϕ(x)⋅ϕ(z)=(x⋅z)2=K(x,z)ϕ(x)⋅ϕ(z)=(x⋅z)2=K(x,z)。
仍取H=R3H=R3以及12√((x(1))2−(x(2))2,2x(1)x(2),(x(1))2+(x(2))2)12((x(1))2−(x(2))2,2x(1)x(2),(x(1))2+(x(2))2)
同样有ϕ(x)⋅ϕ(z)=(x⋅z)2=K(x,z)ϕ(x)⋅ϕ(z)=(x⋅z)2=K(x,z)。