黑客可通过操纵大模型的连续对话上下文回顾机制,构造恶意请求以触发模型进入无限思考循环或超长上下文处理,从而形成对对话服务的DoS攻击(拒绝服务攻击)。这一攻击方式的核心在于利用大模型对上下文处理机制的脆弱性,通过极低的攻击成本实现资源耗尽。

一、攻击原理与实现路径
-
无限推理循环攻击
通过输入特定构造的提示词(如“树中两条路径之间的距离”),诱导模型陷入无限思考链(Chain-of-Thought, CoT)生成。例如:- 资源消耗:模型持续生成重复或冗余的推理步骤,直至达到预设的最大Token限制(如10万Token),导致GPU算力被完全占用。
- 跨模型传播性:攻击可在同系列模型(如DeepSeek-R1及其蒸馏版本)中复现,仅需少量恶意请求即可瘫痪服务。
-
上下文长度饱和攻击
伪造超长对话历史或连续发送大量关联请求,撑爆模型的上下文窗口(如128K Token限制):- 会话历史伪造:通过CCA算法(Context Compliance Attack)伪造对话历史,迫使模型处理大量无效上下文,降低响应速度并占用内存。
- 资源放大效应:单个恶意请求可触发数万Token的无效输出,攻击成本远低于传统DDoS攻击。

最低0.47元/天 解锁文章
465

被折叠的 条评论
为什么被折叠?



