摘要
自然语言处理(NLP)技术在需求工程(RE)领域广泛应用于分类和歧义检测等任务。尽管RE研究以实证为基础,但对NLP4RE研究的复现关注有限。NLP领域的快速发展为机器辅助工作流创造了新机遇。本研究复现并扩展了先前一项NLP4RE研究(基线),该研究评估了深度学习模型对用户评论的需求分类效果。
方法
通过公开源代码复现原始结果,增强了基线研究的外部有效性。扩展实验包括:
- 在外部数据集上评估模型性能
- 与GPT-4o零样本分类器进行对比
- 为基线研究制备复现研究ID卡(用于评估复现准备度)
结果
- 不同模型的复现水平存在差异:朴素贝叶斯实现完全复现,BERT等模型结果混合
- 基线深度学习模型(BERT和ELMo)在外部数据集展现良好泛化能力
- GPT-4o性能与传统基线机器学习模型相当
- 基线研究具备复现准备度,但缺少环境设置文件。本研究在复现包中补充该信息并提供复现ID卡
资源
- 复现包:包含完整代码与环境配置
- 论文:10页,3图,已被AIRE 2025会议接收
- 数据访问:通过提供的HTTPS链接获取
意义
本研究为NLP4RE领域的可重复性研究提供实践范例,推动机器学习在需求工程中的可靠应用。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码

3062

被折叠的 条评论
为什么被折叠?



