基于Sem - CNN方法识别危机信息类别
1. 引言
在Twitter的语境下,识别与危机相关推文所包含的信息类别是一项文本分类任务,目标是确定哪些推文包含哪些类别的危机相关信息。下面将介绍用于识别Twitter上危机相关信息类别的语义增强深度学习模型——Sem - CNN模型。
2. Sem - CNN模型概述
Sem - CNN模型是一种宽深学习模型,它将浅层文本信息在深度卷积神经网络(CNN)模型中与语义注释在广义线性模型中进行联合集成。该模型的流程主要包括五个阶段,如下所示:
graph LR
A[Tweets] --> B[Preprocessing]
B --> C[Concept Extraction]
B --> D[Word Vectors Initialisation]
C --> E[Semantic Vectors Initialisation]
D --> F[Sem - CNN Training]
E --> F
G[Pre - trained Embeddings] --> D
- 文本处理 :对输入的推文集合进行清理和分词,为后续阶段做准备。
- 词向量初始化 :根据上一阶段生成的词袋和预训练的词嵌入,构建一个词嵌入矩阵用于模型训练。
- 概念提取 :与上一阶段并行
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



