36、语言学习中的线性可分性与核计算

语言学习中的线性可分性与核计算

1. 高效核计算

1.1 子序列核定义

子序列特征映射 $\varphi$ 相关的正定对称核 $K$ 定义如下:
对于任意 $x, y \in \Sigma^ $,有 $K(x, y) = \langle\varphi(x), \varphi(y)\rangle = \sum_{u\in\Sigma^ } [[u \sqsubseteq x]] [[u \sqsubseteq y]]$,其中 $[[P]]$ 表示谓词 $P$ 的 0 - 1 真值。这意味着 $K(x, y)$ 计算了 $x$ 和 $y$ 共有的不同子序列的数量。

例如,$K(abc, acbc) = 8$,因为 $abc$ 和 $acbc$ 的共有子序列集合 ${\epsilon, a, b, c, ab, ac, bc, abc}$ 的基数为 8。而 Lodhi 等人定义的核(无惩罚因子)会给 $(abc, acbc)$ 这对字符串赋予值 9,因为他们计算的是共有子序列的出现次数。

1.2 核计算复杂度

一个包含 $n$ 个不同符号的字符串至少有 $2^n$ 种可能的子序列,所以基于枚举 $x$ 和 $y$ 的子序列来简单计算 $K(x, y)$ 效率很低。不过,可以使用 Derryberry 提出的方法在二次时间 $O(|\Sigma||x||y|)$ 内计算 $K(x, y)$,该方法与 Lodhi 等人的方法有些相似。

1.3 相关辅助定义

  • 对于任意符号 $a \in \Sigma$ 和字符串 $u \in \Sigma^*$,定义 $l
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值