依存句法之基于图的依存句法分析
依存句法是由法国语言学家L.Tesniere最先提出。它将句子分析成一颗依存句法树,描述出各个词语之间的依存关系。
例如,句子:坚决惩治贪污贿赂等经济犯罪 的依存结构如下图:
依存句法分析
现在国内外关于依存句法分析的研究主要分三个方面:
- 基于转移的依存句法分析
- 基于语法的依存句法分析
- 基于图的依存句法分析
这里主要记录一些博主对基于图的依存句法分析的学习
基于图的依存句法分析
基于图的依存句法分析就是为每个要分析的句子生成一个有向图,其中:节点是句子中的单词,边是单词之间的依存关系,因为依存句法中规定每个句子都有其核心成分,所以加入了须根节点。依存句法中还规定了句子中除了须根节点,每个词必须依存于其他词,因此,句子依存图中边的个数和单词的个数相等。
我现在做到阶段
例句:反对腐败是贯彻执行党的基本路线的必然要求
预测句子的依存对为:
| 依赖词 | 核心词 |
|---|---|
| **是 | root** |
| 反对 | 要求 |
| 腐败 | 要求 |
| **贯彻 | 要求** |
| 执行 | 要求 |
| 党的基本路线 | 要求 |
| 的 | 要求 |
| 必然 | 反对 |
| 要求 | 党的基本路线 |
正确句子的依存对为:
| 依赖词 | 核心词 |
|---|---|
| 是 | root |
| 反对 | 是 |
| 腐败 | 反对 |
| 贯彻 | 要求 |
| 执行 | 贯彻 |
| 党的基本路线 | 贯彻 |
| 的 | 贯彻 |
| 必然 | 要求 |
| 要求 | 是 |
预测依存对中加粗的是正确的依存对,容易发现,只有两个依存对是正确的,分析效果很不好,可能的原因是我训练特征权重时,没有用预测的依存图和正确的依存图共同作用于权重,使得特征权重有点过拟合。所以,下一步我打算实现解析算法,重新训练特征权重,以提高准确率。
本文介绍了依存句法分析的概念,源于L.Tesniere的语言学理论,重点探讨了基于图的依存句法分析。作者分享了学习过程,并指出当前研究的三个方面:基于转移、语法和图的分析。文章通过示例展示了如何构建有向图来表示句子的依存关系,并提及在分析中遇到的问题,如特征权重的过拟合,计划通过改进算法和训练策略来提升准确性。
939

被折叠的 条评论
为什么被折叠?



