文本处理与图像合成技术:谣言检测、文本到图像合成及命名实体链接
文本基融合神经网络用于谣言检测
方法概述
提出了一种基于文本的融合神经网络(T - FNN)用于谣言检测,该网络深度挖掘全局和局部文本特征。整体架构包含数据处理、卷积模型、双向门控循环单元(BiGRU)、注意力机制等部分。
- 数据处理 :
1. 固定时间间隔数量 N 作为模型输入序列长度。
2. 将事件的清理后帖子均匀分布在所有时间间隔上。
3. 应用预训练的 D 维词嵌入向量表示单词,对单词进行无加权平均计算帖子句子。
- 卷积模型 :使用窗口大小为 Y 的滤波器 f 对输入矩阵进行卷积操作,捕获局部相关性。默认滤波器步长为 1,新特征 FM 计算为 FM = ReLU (f[iv1, iv2, …, ivN] + b)。对 FM 序列进行最大池化操作,保留最重要特征并降低参数维度。选择多个不同窗口大小的滤波器,将所有单个特征拼接得到卷积模型输出矩阵 MultiFM。
- BiGRU :能够捕获事件发展过程中的趋势变化,学习帖子之间的复杂交互,通过结合前向和后向隐藏状态捕获更有效的上下文表示。
- 注意力机制 :为减轻噪声并选择重要帖子,对一组查询 Q 应用注意力操作,输入包括键和值,分别打包到矩阵 K 和 V 中,注意力层输出计算为 Attention (Q, K, V ) = softmax (QKT / √dk) V。
- 流程 :首先用 CNN 捕获各时间
超级会员免费看
订阅专栏 解锁全文
5588

被折叠的 条评论
为什么被折叠?



