本文是LLM系列文章,针对《A Survey on Large Language Model (LLM) Security and Privacy: The Good, the Bad, and the Ugly》的翻译。
大型语言模型(LLM)安全与隐私调查:好的、坏的和丑的
摘要
大型语言模型(LLM),如ChatGPT和Bard,已经彻底改变了自然语言的理解和生成。他们拥有深入的语言理解能力、类人的文本生成能力、上下文意识和强大的解决问题的技能,这使他们在各个领域(如搜索引擎、客户支持、翻译)都非常宝贵。与此同时,LLM也在安全界获得了关注,揭示了安全漏洞,并展示了其在安全相关任务中的潜力。本文探讨了LLM与安全和隐私的交叉点。具体而言,我们调查LLM如何对安全和隐私产生积极影响,与使用LLM相关的潜在风险和威胁,以及LLM中的固有漏洞。通过全面的文献综述,本文将研究结果分为“好的”(有益的LLM应用程序)、“坏的”(攻击性应用程序)和“丑陋的”(漏洞及其防御)。我们有一些有趣的发现。例如,LLM已被证明可以增强代码和数据安全性,优于传统方法。然而,由于其类似人类的推理能力,它们也可以用于各种攻击(特别是用户级攻击)。我们已经确定了需要进一步研究的领域。例如,对模型和参数提取攻击的研究是有限的,而且往往是理论上的,受到LLM参数规模和机密性的阻碍。安全指令调整是最近的发展,需要更多的探索。我们希望我们的工作能够揭示LLM在支持和危害网络安全方面的潜力。