机器学习助力假新闻检测:技术与挑战
1. 假新闻检测的背景与挑战
在信息爆炸的时代,新闻传播变得异常迅速,社交媒体平台如 Facebook 和 Twitter 的兴起,让信息在几分钟内就能传遍大众。然而,这也导致了新闻真实性的下降,假新闻泛滥成灾。假新闻不仅会误导公众,还可能被用于传播产品谣言或影响政治行政工作。
仅依据新闻内容来检测那些误导性事实是一项艰巨的任务,因为新闻内容在风格、主题形式和传递方式上各不相同。因此,建立一个高效的检测系统变得至关重要。
2. 研究方法与目标
本研究着眼于预测新闻文章和新闻特征对结果的不同方法。它们之间的立场可以分为“同意”“偏离”“审查”或“无关紧要”,这取决于新闻文章的相似内容。
研究人员首先研究了一些经典的人工智能模型以建立基线,然后将结果与前沿的深度组织进行比较,以确定文章主体和特征的立场。提出了一个模型,该模型可以通过准确预测特征与新闻文章之间的立场,使用测试方法识别假新闻。此外,还研究了不同的超边界对模型性能的影响,并总结了细节以供未来工作参考。
3. 相关研究综述
在 2017 年,RumorEval(SemEval 2017)和假新闻挑战提出了两个难题。前者有两个子任务:一个用于识别新闻回复的立场,另一个试图将新闻分类为真实或虚假;后者仅进行新闻的立场识别,将新闻的回复分为同意/不同意、讨论和无关。
网络上有许多手动核实事实的网站,如 snopes.com 和 factcheck.org 最为著名,还有一些特定领域的网站,如 politifact.com 用于政治问题。相反,也有一些网站,如 theonion.com,明确
超级会员免费看
订阅专栏 解锁全文
1759

被折叠的 条评论
为什么被折叠?



