推广一下自己的论文,被ACM TURC 2024接受了,ACM临时反水,要求强制OA,但是穷酸学生掏不起OA的费用($500+¥4200,不掏钱就只能发表在TURC的官网上 ,没法出版),无奈只能挂arxiv了,论文方法很简单,希望大家都能有收获!
论文地址:https://arxiv.org/abs/2406.18122
简介:
在本文中,我们提出了间接越狱的概念并通过 LangChain 实现了检索增强生成。在此基础上,我们进一步设计了一种新的间接越狱攻击方法,称为 Poisoned-LangChain (PLC),该方法利用中毒的外部知识库与大型语言模型进行交互,从而导致大型模型生成恶意的不合规对话。我们在三类主要越狱问题中的六种不同的中文大型语言模型上测试了此方法。实验表明,PLC 在三种不同场景下成功实施了间接越狱攻击,成功率分别为 88.56%、79.04% 和 82.69%。实验结果和其他资源: