18、自然语言处理中的有限状态惰性操作与非确定性有限自动机状态复杂度

自然语言处理中的有限状态惰性操作与非确定性有限自动机状态复杂度

有限状态转换器的基本操作

在自然语言处理(NLP)中,有限状态转换器(FST)是非常重要的工具,其常见的基本操作包括Kleene星号和组合操作。

  • Kleene星号 :给定一个FST (T = (\Sigma, \Omega, Q, {i}, F, E)) 来编码关系 (R),关系 (R^{ }=\bigcup_{k\in N} R^{k}) 可由FST (T^{ }=\bigcup_{k\in N} T^{k}) 识别。其中 (T^{*}= (\Omega, \Sigma, Q \cup{i_1}, {i_1}, {i}, E_1)) ,且 (E_1 = E \cup{(i_1, \epsilon, \epsilon, i)} \cup{(f, \epsilon, \epsilon, i) | f \in F})。这一操作在处理字符串序列时非常有用,例如在对文本中的重复模式进行建模时,Kleene星号可以表示零次或多次重复的情况。
  • 组合操作 :假设有两个FST (T_1 = (\Sigma, \Omega, Q_1, {i_1}, F_1, E_1)) 和 (T_2 = (\Omega, \Gamma, Q_2, {i_2}, F_2, E_2)) 分别编码关系 (R_1) 和 (R_2),那么关系 (R_3 = R_1 \circ R_2) 由FST (T_3 = T_1 \circ T_2) 编码。这里 (T_3 = (\Sigma, \Gamma, Q_1 \times Q_2, {i_1}, {
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值