14、自然语言处理中的语法形式主义与解析算法

自然语言处理中的语法形式主义与解析算法

在自然语言处理领域,语法形式主义起着至关重要的作用。LCFRS、MCFG 和 SRCG 等形式主义不仅能够描述语言中的不连续现象,还与其他基于语言学考虑的语法形式主义等价。

1. 依赖关系与 LCFRS 提取

从依赖树库中提取 LCFRS 有相关算法。RCG 的非终结符是边的标签,每个子句都进行了词汇化,词汇项是相应边所指向节点的标签。例如,从依赖树中提取的子句示例如下:

root
aux
pp
aux
r Dar¨uber muß
nachgedacht
werden
pp(Dar¨uber) →ε
root(X1mußX3) →aux(X1,X3)
aux(X1,nachgedacht) →pp(X1)
aux(X1, X2werden) →aux(X1,X2)
2. 等价的语法形式主义
2.1 集合局部多组件 TAG

MCTAG 是一种特殊的 TAG,其基本树被分组为树集。集合局部 MCTAG 的定义基于这样的条件:当使用语法中的一个树集时,该树集中的树必须附加到(或替换)属于之前添加的单个树集的树的节点上。
- 集合局部性条件定义 :设 $G = \langle N, T, S, I, A, A\rangle$ 是一个 MCTAG,$D = \langle V, E, r\rangle$ 是 $G_{TAG}$ 中饱和派生初始树的派生树。$D$ 是集合局部的,当且仅当存在 $V$ 的一个划分 $V_1, \ldots, V_n$,使得

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值