
一、主流大模型的上下文窗口限制
各厂商对大模型API的上下文窗口(Context Window)设定存在显著差异,以下是当前主流模型的限制标准:
-
OpenAI 系列
- GPT-3.5:基础版为4K tokens(约3000汉字),适合简单问答场景
- GPT-4:提供8K/32K两种版本,32K版单次可处理约2.5万字长文本
- GPT-4.5:API调用无固定消息数限制,但按token计费(输入$75/百万token,输出$150/百万token)
-
DeepSeek 系列
- V3/R1模型:64K上下文窗口(约6.4万汉字),输入最多56K tokens(约5.6万字),输出上限8K tokens(约8000字)
-
Claude 系列
- Claude 3.7:支持高达204K tokens的超长上下文(约20.4万字),但实际使用中需避免输入+输出总长度超过该值
-
其他模型
- Gemini:未明确提及具体数值,但通常与GPT-4性能相近
- 智谱清言等国产模型:普遍采用16K-64K的中间档设计 <

最低0.47元/天 解锁文章
851





