提升单词依赖到语义单元依赖:从自然语言需求到领域模型的关键步骤
1. 背景介绍
自然语言需求(Natural Language Requirements, NLR)是软件开发过程中不可或缺的一部分,尤其是在大型复杂系统的设计初期。为了从这些需求中准确提取出领域模型,我们需要将自然语言中的信息转化为结构化、可分析的形式。然而,自然语言的灵活性和复杂性使得这一过程充满挑战。依存分析(Dependency Parsing)是自然语言处理(NLP)中的一种常用技术,它可以识别句子中各词之间的语法依赖关系。但是,依存分析的结果通常是在单词级别,而领域模型构建需要的是更高层次的语义单元依赖关系,如名词短语(Noun Phrases, NPs)和动词短语(Verb Phrases, VBs)之间的关系。
2. 提升过程
2.1 初始化
为了将单词级别的依赖关系提升到语义单元层面,我们首先需要初始化语义单元依赖关系。这一过程依赖于共指解析(Coreference Resolution)的结果,因为共指解析可以识别出代词与其所指实体之间的关系。例如,代词“its”通过共指解析可以指向“模拟器”(Simulator)。初始化步骤确保了语义单元依赖关系的起点是可靠的。
2.2 识别源和目标
接下来,对于每个单词级别的依赖关系,我们需要确定其源和目标是否属于某个名词短语或动词短语。以下是具体的识别过程:
- 输入 :一个集合 ( P ),它由原子名词短语和动词短语组成,以及依赖分析和共指解析的结果。
- 初始化