自然语言需求中自动提取领域模型的技术进展与实证评估
1. 引言
自然语言(NL)广泛用于表达系统和软件需求。构建领域模型是从用自然语言表达的非正式需求过渡到精确和可分析规格的重要步骤。通过明确捕捉应用程序领域的关键概念和关系,领域模型既作为改善所提议应用程序利益相关者之间沟通的有效工具,又作为详细需求和设计阐述的基础。
然而,对于大型系统,手动构建领域模型是一项繁重的任务。为了应对这一挑战,自动化辅助工具应运而生,旨在通过自然语言处理(NLP)技术自动提取候选领域模型元素。本文探讨了这样一个自动化领域模型提取器的设计与实现,重点在于如何利用现代NLP技术来提高模型提取的准确性和实用性。
2. 自动化方法
2.1 基于NLP的自动化方法
我们开发了一种基于自然语言处理的自动化方法,用于从不受限制的需求中提取领域模型。这种方法不仅整合了现有的提取规则,还扩展了这些规则,并提出了新的规则以更好地利用现代自然语言处理依赖解析器获得的结果。以下是该方法的主要技术贡献:
-
扩展现有规则集 :我们结合了来自软件工程文献的现有提取规则以及来自信息检索文献的链接路径。我们进一步提出了新的规则,旨在更好地利用从自然语言处理依赖解析器获得的依赖信息。
-
UML类图表示 :我们使用UML类图来表示提取结果,从而为需求分析和设计提供了结构化的视图。
2.2 方法概述
图7展示了领域模型提取方法的概览。该方法的输入是一个自然语言需求文档,输
超级会员免费看
订阅专栏 解锁全文
1161

被折叠的 条评论
为什么被折叠?



