自然语言处理中的语法形式主义与解析算法
在自然语言处理领域,语法形式主义起着至关重要的作用。LCFRS、MCFG 和 SRCG 等形式主义不仅能够描述语言中的不连续现象,还与其他基于语言学考虑的语法形式主义等价。
1. 依赖关系与 LCFRS 提取
从依赖树库中提取 LCFRS 有相关算法。RCG 的非终结符是边的标签,每个子句都进行了词汇化,词汇项是相应边所指向节点的标签。例如,从依赖树中提取的子句示例如下:
root
aux
pp
aux
r Dar¨uber muß
nachgedacht
werden
pp(Dar¨uber) →ε
root(X1mußX3) →aux(X1,X3)
aux(X1,nachgedacht) →pp(X1)
aux(X1, X2werden) →aux(X1,X2)
2. 等价的语法形式主义
2.1 集合局部多组件 TAG
MCTAG 是一种特殊的 TAG,其基本树被分组为树集。集合局部 MCTAG 的定义基于这样的条件:当使用语法中的一个树集时,该树集中的树必须附加到(或替换)属于之前添加的单个树集的树的节点上。
- 集合局部性条件定义 :设 $G = \langle N, T, S, I, A, A\rangle$ 是一个 MCTAG,$D = \langle V, E, r\rangle$ 是 $G_{TAG}$ 中饱和派生初始树的派生树。$D$ 是集合局部的,当且仅当存在 $V$ 的一个划分 $V_1, \ldots, V_n$,使得
超级会员免费看
订阅专栏 解锁全文
8

被折叠的 条评论
为什么被折叠?



