微博谣言检测与智能海洋治理技术解析
1 微博谣言检测背景与问题提出
微博作为领先的社交媒体平台,方便人们创建、传播和发现内容,但也充斥着大量谣言。这些谣言干扰用户获取有效信息,可能引发公众恐慌,扰乱经济社会秩序。因此,高效检测微博谣言意义重大。
早期谣言检测多采用机器学习技术,通过标注数据集进行监督学习,但特征工程耗时耗力,且需专业背景知识。随着深度学习发展,虽能自动学习数据特征,但基于深度学习的文本表示采用静态预训练模型,词向量训练后不再改变,无法表示不同语境下的多义词。
2 相关研究工作
- 机器学习方法 :早期常用,核心是手动特征提取和分类器训练。如Castillo等提取多种特征,J48决策树准确率达86%;Kwon等提出基于谣言传播的特征,召回率在87% - 92%;Ma等扩展模型;Mao等考虑深度语义特征;Wang等提出新特征,提升了谣言自动检测能力。但该方法依赖特征工程,手动设计特征成本高且需专业知识。
- 深度学习方法 :为解决机器学习方法的问题,研究者开始探索深度学习方法。Ma等首次用深度学习模型进行谣言检测,双层GRU网络检测准确率达91%;Yu用doc2vec获取文本向量,CNN自动学习特征;Ren等用Word2Vec训练词向量,LSTM和GRU检测,准确率达92.66%。但这些研究使用静态预训练模型进行文本向量化,存在无法处理多义词的问题。
3 基于Bert - GRU的微博谣言检测模型
- 模型结构 :先使用Bert模型表示
超级会员免费看
订阅专栏 解锁全文
341

被折叠的 条评论
为什么被折叠?



