本文是LLM系列文章,针对《Can We Edit Multimodal Large Language Models?》的翻译。
摘要
本文主要研究多模态大语言模型(Multimodal Large Language Models, mllm)的编辑。与编辑单模态LLM相比,编辑多模态模型更具挑战性,在编辑过程中需要更高水平的审查和仔细考虑。为了促进这一领域的研究,我们构建了一个新的基准,称为MMEdit,用于编辑多模态llm并建立一套创新的评估指标。我们进行了涉及各种模型编辑基线的综合实验,并分析了编辑不同组件对多模态llm的影响。经验上,我们注意到以前的基线在一定程度上可以实现编辑多模态llm,但效果仍然勉强令人满意,表明这项任务的潜在难度。我们希望我们的工作可以为NLP社区提供见解。
1 引言
2 相关工作
3 编辑多模态LLM
4 实验
5 结论
本文介绍了基于MMEdit的多模态模型编辑技术。在经验上,我们分析了各种模型编辑基线的有效性,并探讨了它们对不同组件(例如,视觉和文本)的影响。
本文探讨了编辑多模态大语言模型(mllm)的挑战,建立了MMEdit基准和评估指标,实验分析了编辑对模型组件的影响,发现现有方法效果有限,提出该任务的难度。
953

被折叠的 条评论
为什么被折叠?



