Mining Semantic Information in rumor detection via a deep visual perception based recurrent nerual networks,fengxing,2019-bigdata
主要内容
将社交事件流转换成连续时间序列,利用无偏CNN相关帖子的潜在语义,得到VIP注意向量,使用VIP注意向量指导RNN从上下文信息学习长距离依赖关系
提出方法
构建社会事件的可变长度时间序列
- 对事件中的帖子进行块的划分,保证块之间仍然存在时间顺序和相互影响。
- 对所有事件采取同样的划分原则:
- 在时间轴上距离较近的帖子被分到同一批次,使得事件阶段不中断
- 爆发期的帖子应妥善划分
- 所以,最终的划分结果是:对帖子进行均等划分,使得每个时间段的贴子数量一致
- normal all time steps to 0-1
- 为了建模不同的时间序列:
- 使用每一个interval中词汇术语的TF-IDF值
- 使用前K个频率词汇,代表词汇的重要度。
- 用一个K维的稀疏矩阵代表time inteval中的事件
- 每一个事件用K*N的矩阵进行编码,K表示词汇数量,N表示time interval数量
Vip RNN模型
- 时间序列建模好之后,作为输入通过嵌入层(dense embeding)转换成密集的嵌入向量,再分别输入LSTM中学习得到事件的表示(用LSTM的最后一个隐藏状态作为语义表示,此时已实现对事件的全部信息进行编码)
- text-VGG:无偏CNN学习得出事件的高级表示
Vip attention
- 表征两个子网络(LSTM、VGG)之间的相关性