提升自然语言需求中的领域模型提取:方法与实证评估
1. 引言
自然语言(NL)广泛用于表达系统和软件需求。从自然语言需求过渡到精确和可分析的规格是软件开发过程中至关重要的一步。领域模型作为改善应用程序利益相关者之间沟通的有效工具,同时也是详细需求和设计阐述的基础。然而,对于大型系统,手动构建领域模型是一项繁重的任务。因此,开发一种自动化解决方案来帮助工程师从自然语言需求中提取领域模型显得尤为重要。
自动化领域模型提取的核心挑战在于自然语言的复杂性和多样性。现有的方法通常假设对自然语言需求的语法和结构有所限制,但在许多工业情况下,这些限制可能无法满足。因此,本文开发了一种自动化领域模型提取器,通过整合软件工程文献中现有的提取规则,用信息检索文献中的补充规则扩展这些规则,并提出新的规则以更好地利用现代自然语言处理(NLP)依赖解析器的结果。
2. 现有技术状况
为了理解现有技术的局限性,我们回顾了领域模型提取的相关文献,并总结了最新的提取规则。这些规则根据它们提取的信息的性质(概念、关联和泛化、基数和属性)被组织成四个类别。表1展示了现有的领域模型提取规则。
| 类别 | 规则 | 描述 |
|---|---|---|
| 概念 | A1 | 需求中的所有名词短语(NP)都是候选概念。 |
| 概念 | A2 | 重复的名词短语是概念。 < |
超级会员免费看
订阅专栏 解锁全文
1100

被折叠的 条评论
为什么被折叠?



