27、微博谣言检测数据集构建与鲁棒神经网络学习方法

微博谣言检测数据集构建与鲁棒神经网络学习方法

1. 微博谣言检测与WeiboCluster数据集概述

谣言是一种特殊的语言现象。随着新浪微博用户的不断增加,信息传播的管理变得愈发困难。由于“蝴蝶效应”,一条错误信息也可能对我们的生活产生重大影响。在紧急情况下,虚假谣言的传播会危及公民的福祉,因为他们会通过社交媒体的新闻流来了解最新动态。因此,近年来社交网络上的谣言检测问题受到了广泛关注。

深度学习是一项新兴技术,在不同领域得到了快速发展和广泛应用。循环神经网络(RNN)作为深度学习技术之一,在处理时间序列问题方面具有出色的能力。然而,深度学习的结果在很大程度上依赖于用于训练的数据集。对于谣言检测而言,目前缺乏统一、公开且合适的数据集供研究人员使用。

为了解决这一问题,提出了一种收集适合谣言检测的微博数据集的完整流程——WeiboCluster。该流程方便快捷,所得到的WeiboCluster数据集尽可能满足机器学习的要求,包含用户信息、微博信息等。

2. 构建WeiboCluster数据集
2.1 面向事件的收集

该数据集的主要目标是利用深度学习技术,特别是使用神经网络的方法来检测谣言。神经网络依赖神经元之间的权重来挖掘数据的潜在知识,对于谣言检测,不同的事件显然不应混合。最合理的状态是一个事件对应一组权重,即当向训练好的神经网络输入关于新事件的微博时,需要重新训练该网络。

因此,采用面向事件的收集方式。新浪微博有一个辟谣的官方账号,该账号会定期发布一些微博来澄清谣言,通过这些微博可以轻松找到指示谣言的关键词。例如,一条声称北京将有大雨的微博,其主题可作为事件标签,利用新浪微博的搜索功能,能快

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值