TagDeepRec:基于注意力机制的软件标签推荐方法
在软件开发和信息管理领域,为软件对象准确添加标签是一项重要且具有挑战性的任务。合适的标签能够帮助开发者更高效地组织和检索信息,提高开发效率。本文将介绍一种名为TagDeepRec的自动标签推荐方法,它利用基于注意力机制的双向长短期记忆网络(Bi-LSTM)模型,在多个软件信息网站上取得了良好的效果。
1. 问题定义
在软件信息网站中,软件对象通常包含标题、正文和标签等属性。我们将标题和正文的信息组合成一个新的问题描述。同时,过滤掉出现频率较低的标签,将剩余的标签定义为候选标签集。给定一个新的软件对象,TagDeepRec的目标是通过学习现有的软件对象及其对应的标签,从候选标签集中为其分配合适的标签,以帮助开发者选择合适的标签。
例如,在StackOverflow网站上,一个软件对象可能包含标题“Binary Data in MySQL, How do I store binary data in MySQL?”、正文以及标签{mysql, binary-data}。我们将标题和正文组合成问题描述,然后从候选标签集中为其推荐标签。
2. 推荐方法
2.1 方法概述
TagDeepRec的整体框架包含三个阶段:数据准备、训练和部署。
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A(数据准备):::process --> B(训练):::process
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



