18、句法分析中的高级算法与特征集成

句法分析中的高级算法与特征集成

1. 内外算法

1.1 外部算法

当 outside(1, n, X ) 在特定条件下等于 1,否则为 0 时,我们可以自顶向下构建外部表 outside[i][j][X ]。该算法的伪代码如算法 10.3 所示,其中 i 和 s 分别表示当前跨度的起始位置和大小,此算法被称为外部算法。需要注意的是,每个单元格相关单元格的枚举顺序与公式 10.6 不同。

1.2 内外算法

由于边缘概率可以通过内部概率和外部概率的乘积来计算(公式 10.3),因此用于计算边缘概率的整体算法被称为内外算法。内外算法在概念上与用于序列任务边缘概率计算的前向后向算法相似,但主要区别在于每个成分节点有两个子节点,而不是一个。算法 10.2 和算法 10.3 仅考虑了 CNF 形式,对于涉及一元规则的情况,可参考练习 10.5。

2. 成分句法分析的更多特征

2.1 词汇化 PCFG

2.1.1 PCFG 的局限性

PCFG 作为一种生成模型,在消歧特征方面较为简单,这限制了其性能。例如,PCFG 的语法规则与词汇信息隔离,除了成分树中与叶节点相关的规则。以动词短语规则为例,在 PCFG 中,两条描述及物动词和不及物动词短语的规则概率计算与实际动词无关,导致对于包含及物动词的句子,PCFG 无法判断哪条规则更适合生成动词短语。

2.1.2 词汇化 PCFG 的解决方案

为解决这一问题,可以将词汇信息融入 PCFG 的成分标签中。例如,将成分标签 VP 扩展为多个标签,如 VP[like]、VP[eat]、VP[un

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值