Introduction(介绍)
本篇论文中,专注于探讨用于零样本谣言检测的有效提示方法,涉及语言和领域的转移。可以解耦共享的语义信息和特定语言中的句法偏差,从而增强提示与谣言数据之间的语义交互。此外,由于谣言的传播通常遵循空间和时间关系,这些关系提供了有关主张如何传播的有价值线索,而与特定领域无关。为此,提出了一种零样本响应感知提示学习(RPL)框架,用于在社交媒体上检测跨语言和跨领域的谣言。
解释:
将共享的语义信息(文本的含义)和特定语言中的句法偏差(特定语言的语法结构差异)分开,不让它们混在一起。这样做的目的是为了在生成提示(prompt)和谣言数据之间建立更好的语义交互,不受特定语言的语法差异的干扰。
零样本谣言检测任务(ZRD)旨在将源谣言数据中学到的知识适应到目标数据中,而目标语言和领域中没有标记的训练样本。
具体流程:
训练时,模型接收一段文本,并在其中随机选择一些词汇进行掩盖。模型的任务是根据上下文预测这些被掩盖的词汇。然后进行预训练得到通用的语言表示。
Problem Statement and Background(问题陈述和背景)
在这项工作中,将零样本谣言检测任务定义为:给定一个源数据集,对目标数据集中的每个事件进行分类,判断其是否为谣言。源数据集和目标数据集来自不同的语言和领域。
具体而言:
源数据集,定义为一组事件表示为 ,每个事件是一个三元组表示为
,其中
表示一个真实性标签{谣言,非谣言}与
主张(是某一事件或主题中的论述或陈述,它可以是一个观点、说法或声明)相关,以及理想情况下按时间顺序排列的所有相关响应微博帖子
(m为响应帖子的数量)。
目标数据集,定义为一组事件表示为
,每个事件是一个二元组表示为
(与源数据集相似)。
这个任务可以被建模为一个监督分类问题,训练一个语言/领域无关的分类器
,将从源数据集学到的特征迁移到目标事件,即
。
在这项工作中,我们将谣言检测转化为一种填空式掩码语言建模问题。例如,给定一个填空式模板
(例如,"For this [MASK] story." 作为提示,与主张 c 拼接成 ),标准的提示学习利用预训练语言模型(PLMs)获取[MASK]令牌的隐藏状态,推断填充[MASK]的谣言指示性词语。
标签 的概率为
![]()
公式解释:
其中
是一组与谣言相关的标签词语,
是与
对应的
的子集,
是一个手动的语言表达器,将标签词语的概率转换为标签的概率。通过这种方式,我们可以将对[MASK]的预测词映射到真实性标签,从而对主张做出决策。
Approach(方法)
模型结构图:

Response Ranking:
为了突显社交背景,增强事件的上下文表示学习,提出通过关注证据性响应来实现。核心思想是基于不同的传播线索对所有响应进行排名。
时间序列
假设随着时间的推移,响应性帖子对事件的态度会变得更倾向于一方,因此响应性帖子可以按照时间顺序和时间序列的反向顺序进行排序。分别为


最低0.47元/天 解锁文章
2417





