多任务卷积神经网络模型在引文分类及交通流量预测中的应用
引言
在学术研究和交通领域,分别面临着引文分类和交通流量预测的重要问题。在引文分类方面,传统的机器学习方法存在特征提取耗时、依赖特定领域等问题,而在交通流量预测中,准确预测一直是难题,且以往模型往往忽略了如降水等环境因素的影响。本文将介绍多任务卷积神经网络(Multitask - CNN)模型在引文分类中的应用,以及基于轨迹数据考虑降水影响的深度交通流量预测架构(P - DBL)。
多任务卷积神经网络模型在引文分类中的应用
数据集与基线模型
为评估提出的多任务卷积神经网络(Multitask - CNN)模型在引文分类上的性能,使用了两个公开可用的数据集:
- 数据集1(Dataset1) :包含3568个引文上下文示例,每个示例由四句组成,即引用给定被引论文的句子、前一句和后两句,所有上下文都标注了引文情感和目的。
- 数据集2(Dataset2) :基于从ACL语料库中随机提取的引文句子构建,有1768个实例,每个示例仅包含一个句子作为上下文,并标注了引文情感和目的分类任务。
两个数据集在不同分类任务下的示例分布情况如下表所示:
| 分类任务 | 数据集1 | | 数据集2 | |
| — | — | — | — | — |
| | 类别 | 比例(%) | 类别 | 比例(%) |
| 引文情感 | 积极 | 32.6 | 积极 | 10.75 |
| | 消极 | 12.4 | 消极 | 3.22 |
| | 中立
超级会员免费看
订阅专栏 解锁全文
1154

被折叠的 条评论
为什么被折叠?



