大语言模型应用指南:越狱攻击与数据投毒 作者:禅与计算机程序设计艺术 1. 背景介绍 1.1 大语言模型概述 1.1.1 大语言模型的定义与特点 1.1.2 大语言模型的发展历程 1.1.3 大语言模型的应用领域 1.2 大语言模型面临的安全挑战 1.2.1 越狱攻击的概念与危害 1.2.2 数据投毒的概念与危害 1.2.3 其他潜在的安全风险 2. 核心概念与联系 2.1 大语言模型的训练机制 2.1.1 预训练阶段 2.1.2 微调阶段 2.1.3 推理阶段 2.2 越狱攻击的原理与方法 2.2.1 利用提示工程绕过限制 2.2.2 利用多轮对话累积影响