36、语言学习中的线性可分性与核计算

assembly8low

于 2025-10-09 14:44:10 发布

阅读量15

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习理论前沿探析文章标签：子序列核线性可分性支持向量机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/assembly8low/article/details/153553350

机器学习理论前沿探析专栏收录该内容

46 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

语言学习中的线性可分性与核计算

1. 高效核计算

1.1 子序列核定义

子序列特征映射 $\varphi$ 相关的正定对称核 $K$ 定义如下：
对于任意 $x, y \in \Sigma^ $，有 $K(x, y) = \langle\varphi(x), \varphi(y)\rangle = \sum_{u\in\Sigma^ } [[u \sqsubseteq x]] [[u \sqsubseteq y]]$，其中 $[[P]]$ 表示谓词 $P$ 的 0 - 1 真值。这意味着 $K(x, y)$ 计算了 $x$ 和 $y$ 共有的不同子序列的数量。

例如，$K(abc, acbc) = 8$，因为 $abc$ 和 $acbc$ 的共有子序列集合 ${\epsilon, a, b, c, ab, ac, bc, abc}$ 的基数为 8。而 Lodhi 等人定义的核（无惩罚因子）会给 $(abc, acbc)$ 这对字符串赋予值 9，因为他们计算的是共有子序列的出现次数。

1.2 核计算复杂度

一个包含 $n$ 个不同符号的字符串至少有 $2^n$ 种可能的子序列，所以基于枚举 $x$ 和 $y$ 的子序列来简单计算 $K(x, y)$ 效率很低。不过，可以使用 Derryberry 提出的方法在二次时间 $O(|\Sigma||x||y|)$ 内计算 $K(x, y)$，该方法与 Lodhi 等人的方法有些相似。

1.3 相关辅助定义

对于任意符号 $a \in \Sigma$ 和字符串 $u \in \Sigma^*$，定义 $l

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。