深度学习与图像识别算法研究
深度学习框架实验设置
在深度学习领域,针对非功能需求(NFRs)的文本分类任务进行了一系列实验。首先是实验设置阶段,这一阶段包含多个关键部分。
训练语料
用于NFRs的基准文本语料由1484个从软件需求规格说明书(SRS)文档中提取的句子组成,涵盖了效率、可维护性、可移植性、可靠性和可用性这五个主要的NFRs类别。不同类别的句子数量不同,具体分布如下表所示:
| 类别 | 原始数据 | EDA增强数据 | CUSTOM增强数据 |
| ---- | ---- | ---- | ---- |
| 效率 | 480 | 1440 | 960 |
| 可维护性 | 240 | 720 | 480 |
| 可移植性 | 156 | 468 | 320 |
| 可靠性 | 191 | 573 | 382 |
| 可用性 | 417 | 1251 | 834 |
| 总样本数 | 1484 | 3972 | 2976 |
特征学习
在进行必要的预处理(如去除停用词和序列填充)后,采用了多种方法进行特征训练,包括人工神经网络(ANN)、卷积神经网络(CNN)、长短期记忆网络(LSTM)和门控循环单元(GRU)。
- ANN表示学习器 :构建了一个5层的ANN,在嵌入层之后,第一层、第二层和第三层分别有1024、512和256个单元。在第一个全连接层之前使用全局最大池化层,以从嵌入层获得一维输出。另外使用两个分别有64个神经元和5个神经元的全连接层来得到分类器的输出。
-
超级会员免费看
订阅专栏 解锁全文
5593

被折叠的 条评论
为什么被折叠?



