实证评估:提取规则触发频率
1. 引言
领域模型提取是从自然语言需求向精确规范过渡的重要步骤。随着现代自然语言处理(NLP)技术的发展,自动化提取领域模型变得越来越可行。然而,现有模型提取方法在工业应用中的性能仍缺乏充分的实证证据。本文将重点探讨不同提取规则在处理工业需求文档时的触发频率,从而为理解这些规则在实际环境中的有效性和适用性提供实证依据。
2. 研究问题
为了评估不同提取规则的触发频率,我们设定了以下研究问题(RQ1):
- RQ1. 不同提取规则触发的频率是多少?
3. 数据集描述
我们的评估基于四份工业需求文档,这些文档都是用英文写成的“shall”需求的集合。表 5简要描述了这些文档,并总结了它们的主要特征。这些文档分别标记为案例 A-D,并涵盖了多个不同领域的软件系统。
案例 | 描述 | 使用模板 | 符合模板的需求 (%) |
---|---|---|---|
案例 A | 卫星数据分发网络 | No | 64% |
案例 B | 安全认证的安全证据信息管理系统 | Yes | 89% |
案例 C |