文本分类技术:从软件需求到隐喻语言的探索
在自然语言处理(NLP)领域,文本分类是一项至关重要的任务,它在软件需求分析、隐喻语言识别等多个方面都有着广泛的应用。本文将深入探讨软件需求分类和隐喻语言分类的相关技术和方法。
软件需求分类的多方法探索
在软件需求分类方面,研究人员采用了多种技术和方法。
多种分类技术概述
- 功能与非功能需求分类 :有研究提出了对不同来源数据集构建的功能和非功能需求进行分类的解决方案。在预处理和特征提取阶段后,使用逻辑回归和多项朴素贝叶斯分类器进行分析。预处理技术包括分词、去除停用词等,特征提取采用TF - IDF进行向量化。
- 半监督学习用于NFR分类 :半监督学习结合了监督学习和无监督学习。通过使用一个包含已分类数据和未分类数据的集合,先利用已分类数据学习,再为未分类数据关联类别。有研究采用半监督自动化技术对非功能需求(NFR)进行自动分类,先由需求分析团队选择和排序一组需求作为训练集,然后机器识别剩余未分类需求。同时,使用TF - IDF进行向量化,还采用了BoW和N - Grams向量模型以及朴素贝叶斯、k - nn和SVM等分类器。
- 混合搜索技术用于预测 :还有研究使用混合搜索技术进行软件变更预测,分析和比较了五种基于混合搜索的技术、四种机器学习技术以及一种统计技术对六个安卓操作系统应用程序包中易变更类别的预测性能。
提出的解决方案:基于领域知识的用户意见分类
为了预测社交网络中用户意见对软件领域
超级会员免费看
订阅专栏 解锁全文
955

被折叠的 条评论
为什么被折叠?



