谣言止于智者:基于深度强化学习的谣言早期检测模型

本文提出了一种基于深度强化学习的谣言早期检测模型ERD,它能动态设置检测点,实现在保证准确率的同时,提早识别社交媒体中的谣言。模型通过GRU和强化学习模块,对帖子序列进行特征提取和决策,提高了谣言检测的时效性和准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

640


「论文访谈间」是由 PaperWeekly 和中国中文信息学会社会媒体处理专委会(SMP)联合发起的论文报道栏目,旨在让国内优质论文得到更多关注和认可。

 

640?wx_fmt=png


640?wx_fmt=png


谣言一般是指未经核实的陈述或说明,它往往与某一事件相关,在大众之间广泛传播。而随着社交媒体的发展,谣言可以通过社交媒体以核裂变的方式快速传播,这往往会引发诸多不安定因素,并对经济和社会产生巨大的影响。


谣言从产生到传播直至造成危害,往往会经历一段时间的演化,在这期间会有大量的相关信息伴随源信息而发布。图 1 描述的是在 Twitter 上传播的一则谣言——“一个 17 岁黑人小孩因偷窃糖果被警察击毙”。


我们以源消息的发布作为时间原点,不难发现该信息一经发布便在 Twitter 上引发轩然大波,但遗憾的是,直至发布 24 小时后才有消息证实该信息为谣言。然而,此时该谣言已经在社交媒体上广泛传播,并造成不可挽回的影响。因此,本文旨在研究社交媒体中谣言的早期检测。


640?wx_fmt=png


谣言的早期检测通常是指谣言刚产生的几小时内,即谣言在这期间被发现,其可控性强,产生的危害性弱。现有研究成果大多集中在如何更准确的进行谣言检测,其往往忽视了谣言检测的时效性需求。少数涉及早期谣言检测的,也只是简单比较不同静态检测点上的准确率,即仅用预先定义好的固定检测点前的数据进行检测,并比较准确率。


实际上,静态检测点并不是明智之举,不同的谣言在社交媒体上的爆点时间并不相同,有些谣言会因为时间的设置过早而无法保证检测准确率,有些谣言则会因为设置过晚而无法保证其检测时效性。因此,谣言的判别应依照不同的事件,动态地设置检测点,从而实现谣言的早期发现。


为了解决这一问题,本文提出了一个基于强化学习的谣言早期检测模型,该模型将社交媒体中发布的帖子按其发布时间以信息流的形式进行输入。每当一个新帖子到来,模型都会对其进行判别,并将判别结果输入到强化学习模块,强化学习模块利用奖励机制对当前检测结果进行判断,并根据准确率来进行策略选择。如果准确率满足要求,则输出判别结果,否则继续监听。通过这种方式,不仅实现了谣言的早期发现,同时还能保证检测的准确率。


模型


不失一般性,我们用E表示一个待检测的事件,它往往有一系列相关的帖子构成640?wx_fmt=png,其中640?wx_fmt=png表示源信息,640?wx_fmt=png表示截至当前时间点最新发布的帖子。谣言早期判别模型的设计目标就是为了尽可能早的判别 E 是否是一个谣言。 


谣言早期判别模型(Early Rumor Detection,ERD)主要包括两个部分:检测点模块(Checkpoint Module,CM)谣言检测模块(Rumor Detection Module,RDM)


其中谣言检测模块用于判别某一事件是否为谣言,而检测点模块用于判断是否触发 RDM。这里 CM 扮演了一个重要的角色,它用来决定何时对相关事件进行判别。该模型的创新之处在于利用强化学习方法来发现最优的检测点,同时采用交替学习的方式优化两个模块,可以在保证准确率的前提下,尽早识别谣言。模型框架如下图所示。


640?wx_fmt=png

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值