Multimodal Large Language Models to Support Real-World Fact-Checking

UnknownBody

于 2024-07-03 08:56:34 发布

阅读量161

点赞数

CC 4.0 BY-SA版权

分类专栏： LLM Daily Multimodal 文章标签：语言模型人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/140136197

LLM Daily 同时被 2 个专栏收录

1392 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

129 篇文章

订阅专栏

本文是LLM系列文章，针对《Multimodal Large Language Models to Support Real-World Fact-Checking》的翻译。

支持真实世界事实核查的多模态大型语言模型

摘要
1 引言
2 相关工作
3 评估框架
4 实验设置
5 实验结果
6 局限性
7 结论和未来工作

摘要

虚假信息对现实世界构成威胁，尤其是与误导性图像相结合时。多模态大语言模型将图像理解与语言模型丰富的知识和解释能力相结合，已成为人类处理大量信息的工具。然而，它们作为协助事实核查的多模态工具的能力和局限性仍然研究不足。以下是弥合这一差距的目标。特别是，我们提出了一个系统评估当前多模态模型能力的框架，以促进现实世界的事实核查。我们的方法是无证据的，只利用这些模型的内在知识和推理能力。通过设计提取模型预测、解释和置信水平的提示，我们对模型的准确性、偏差和其他关键因素进行了详细分析。我们根据经验发现，（1）GPT-4V在各种数据集中表现出令人惊讶的性能，准确率超过80%，并能够提供令人印象深刻的解释；（2）即使有提示集成和上下文学习的帮助，开源模型的性能也明显滞后。然而，它们在记住核对过的声明和推理出被操纵的图像方面显示出潜力。我们还总结了失败的原因，这有助于制定未来改进的策略。我们的研究为利用MLLMs打击多模态错误信息提供了见解。

1 引言

2 相关工作

3 评估框架

4 实验设置

5 实验结果

6 局限性

7 结论和未

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。