本文是LLM系列文章,针对《Security and Privacy Challenges of Large Language Models: A Survey》的翻译。
大型语言模型的安全和隐私挑战:一项调查
摘要
大型语言模型(LLM)已经展现出非凡的能力,并在多个领域做出了贡献,如生成和总结文本、语言翻译和问答。如今,LLM正成为计算机语言处理任务中非常流行的工具,能够分析复杂的语言模式,并根据上下文提供相关和适当的回应。这些模型在提供显著优势的同时,也容易受到安全和隐私攻击,如越狱攻击、数据中毒攻击和个人身份信息(PII)泄露攻击。这项调查全面审查了LLM对训练数据和用户的安全和隐私挑战,以及交通、教育和医疗保健等各个领域中基于应用程序的风险。我们评估LLM漏洞的程度,调查LLM新出现的安全和隐私攻击,并审查潜在的防御机制。此外,该调查概述了该领域现有的研究空白,并强调了未来的研究方向。