4、二分类支持向量机:原理、特性与应用

二分类支持向量机:原理、特性与应用

1. 映射到高维空间

1.1 字符串映射

在某些情况下,输入数据会被映射到一个 $lk$ 维的空间,也就是所有长度为 $k$ 的字符串的组合。对于长度为 $k$ 的输入字符串,如果它与变量字符串的差异最多为 $k$ 个不匹配,那么特征空间中对应变量的值为 1,否则为 0。对于任意输入,变量的值是输入中所有 $k$ 子字符串的不匹配计数。然后通过特征空间中变量的点积来计算核值。

1.2 动态时间对齐核

在语音识别中,需要匹配不同长度的数据序列。Shimodaira 等人提出了动态时间对齐核。设两个向量序列为 $X = (x_1, \ldots, x_m)$ 和 $Y = (y_1, \ldots, y_n)$,其中 $m$ 和 $n$ 通常不同。动态时间对齐核定义为:
[
H_s(X, V) = \max_{\varphi,\theta} \frac{1}{M_{\varphi\theta}} \sum_{k = 1}^{L} m(k) g^T(x_{\varphi(k)}) g(x_{\theta(k)}) = \max_{\varphi,\theta} \frac{1}{M_{\varphi\theta}} \sum_{k = 1}^{L} m(k) H(x_{\varphi(k)}, x_{\theta(k)})
]
其中,$L$ 是归一化长度,$m(k)$ 是权重,$M_{\varphi\theta}$ 是归一化因子,$\varphi(\cdot)$ 和 $\theta(\cdot)$ 是通过动态规划对齐两个序列的时间对齐函数,以使它们变得相似。

1

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值