自然语言需求中关联提取的技术与实践
1. 关联的来源
在自然语言需求中,关联(relationships)是从动词短语(VBs)中提取出来的,这些动词短语通常具有主语或宾语或两者。关联是领域模型中不可或缺的一部分,它们描述了不同概念之间的关系,为系统设计提供了重要的结构信息。为了确保提取的关联能够准确反映需求中的信息,我们需要从自然语言处理(NLP)的角度出发,深入理解动词短语的结构和语义。
2. 处理不同的主题类型
在处理自然语言需求时,动词短语的主语部分可能会有不同的表现形式。表4列出了几种常见的主题类型,并给出了具体的示例。通过这些示例,我们可以更好地理解如何处理不同类型的主题。
主题类型 | 示例 |
---|---|
简单主题 | “操作员应初始化系统配置。” |
被动主题 | “系统配置应由操作员初始化。” |
属格主语 | “地面站的操作员应当初始化系统配置。” |
处理这些主题类型的过程统一并概括了表1中的规则B1和B2。具体来说,规则B1适用于所有及物动词,而规则B2处理带有介词的动词。通过这种方式,我们可以更全面地捕获需求中的关联信息。
3. 新规则的引入
为了提高关联提取的准确性和覆盖面,文中