机器学习基石 之 非线性转换(Nonlinear Transformation)

本文探讨了在面对非线性可分数据时,如何通过非线性转换将原始特征空间映射到高维空间,使数据变得线性可分。介绍了基本的非线性转换方法,如二次假设集和多项式假设集,并讨论了非线性转换的代价,即随着转换复杂度增加,模型的VC维度和训练误差的变化。

非线性转换(Nonlinear Transformation)

前面讲了许多线性模型,但是假如数据并不是线性可分的,该如何处理呢?基本思路是将数据样本(特征)空间 X\mathcal{X}X 映射Z\mathcal{Z}Z 空间后,在 Z\mathcal{Z}Z 空间数据是线性可分的话,便可以在 Z\mathcal{Z}Z 空间上使用线性模型对数据分析。

那么该映射叫做非线性特征转换 Φ\PhiΦ((nonlinear) feature transform )实现的是:
x∈X⟼Φz∈Z \mathbf { x } \in \mathcal { X } {\mathop \longmapsto ^ \mathbf { \Phi }} \mathbf { z } \in \mathcal { Z } xXΦzZ
学习的基本步骤如下:

  • transform original data { (xn,yn)}\left\{ \left( \mathbf { x } _ { n } , y _ { n } \right) \right\}{ (xn,yn)} to { (zn=Φ(xn),yn)}\left\{ \left( \mathbf { z } _ { n } = \mathbf { \Phi } \left( \mathbf { x } _ { n } \right) , y _ { n } \right) \right\}{ (zn=Φ(xn),yn)}
  • get a good perceptron w~\tilde { \mathbf { w } }w~ using { (zn=Φ(xn),yn)}\left\{ \left( \mathbf { z } _ { n } = \mathbf { \Phi } \left( \mathbf { x } _ { n } \right) , y _ { n } \right) \right\}{ (zn=Φ(xn),yn)} and your favorite linear classification algorithm A\mathcal{A}A
  • return g(x)=sign⁡(w~TΦ(x))g ( \mathbf { x } ) = \operatorname { sign } \left( \tilde { \mathbf { w } } ^ { T } \mathbf { \Phi } ( \mathbf { x } ) \right)g(x)=sign(w~TΦ(x))

常用的非线性转换 (General Nonlinear Transform)

General Quadratic Hypothesis Set

基本形式为:
Φ2(x)=(1,x1,x2,x12,x1x2,x22) \Phi _ { 2 } ( \mathbf { x } ) = \left( 1 , x _ { 1 } , x _ { 2 } , x _ { 1 } ^ { 2 } , x _ { 1 } x _ { 2 } , x _ { 2 } ^ { 2 } \right) Φ2(x)=(1,x1,x2,x12,x1x2,x2

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

FlameAlpha

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值