用户需求自动分类复现研究解析

摘要

自然语言处理(NLP)技术在需求工程(RE)领域广泛应用于分类和歧义检测等任务。尽管RE研究以实证为基础,但对NLP4RE研究的复现关注有限。NLP领域的快速发展为机器辅助工作流创造了新机遇。本研究复现并扩展了先前一项NLP4RE研究(基线),该研究评估了深度学习模型对用户评论的需求分类效果。

方法

通过公开源代码复现原始结果,增强了基线研究的外部有效性。扩展实验包括:

  1. 在外部数据集上评估模型性能
  2. 与GPT-4o零样本分类器进行对比
  3. 为基线研究制备复现研究ID卡(用于评估复现准备度)

结果

  • 不同模型的复现水平存在差异:朴素贝叶斯实现完全复现,BERT等模型结果混合
  • 基线深度学习模型(BERT和ELMo)在外部数据集展现良好泛化能力
  • GPT-4o性能与传统基线机器学习模型相当
  • 基线研究具备复现准备度,但缺少环境设置文件。本研究在复现包中补充该信息并提供复现ID卡

资源

  • 复现包:包含完整代码与环境配置
  • 论文:10页,3图,已被AIRE 2025会议接收
  • 数据访问:通过提供的HTTPS链接获取

意义

本研究为NLP4RE领域的可重复性研究提供实践范例,推动机器学习在需求工程中的可靠应用。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值