文章目录
claude3.7 原理简介
亮点:编程长板进一步提升
2025 年 2 月 28 日下午 5:25,Anthropic发布了claude3.7 sonnet模型,这是首个混合推理语言大模型,即参照人类思考系统的快速反应与慢反思结合的工作模式,将LLM快速响应和思维链深度思考功能集成到统一的大模型中。其核心特点是能够在标准模式下提供近乎即时的响应,或在扩展思考模式下进行可见的逐步推理。
从官网的介绍中,可以看到claude3.7在自己的长板能力(编程和前端开发)上取得了进一步的提升;


扩展思考模式(Extended Thinking Mode)
扩展思考模式允许 Claude 在给出最终答案前,通过生成一系列 token 逐步推理问题。该功能特别适合数学问题、复杂分析、多步骤推理等任务。
可控推理
受deepseek公开推理过程的影响,claude3.7 Sonnet也公开了思维链,用户在API调用时还可控制模型思考深度,以平衡性能和计算资源;
训练数据多样性
claude3.7 sonnet的model card中介绍,claude3.7的训练数据包括互联网公开信息、第三方非公开数据、数据标准承包商提供的数据、内部生成的数据。通过去重、分类等多种数据清洗和过滤方法,确保训练数据的高质量。训练数据日期截止到2024年10月底。
安全对齐时,在强化学习

最低0.47元/天 解锁文章
615

被折叠的 条评论
为什么被折叠?



