Anthropic推出“可见扩展思维”技术:让AI像人类一样思考,小白也能看懂的深度解析

引言:AI的“思考”过程终于可见了!
你是否曾好奇,像ChatGPT这样的AI在回答问题时,内部究竟是如何“思考”的?最近,Anthropic公司推出的Claude 3.7 Sonnet模型给出了答案!通过“可见扩展思维”(Visible Extended Thinking)技术,Claude首次向用户展示了AI生成答案的完整思考路径,就像人类写草稿一样逐步推演。本文将从技术原理、实际应用和未来影响三个方面,带小白用户看懂这项革命性技术。
一、什么是“可见扩展思维”?
简单来说,这是Claude 3.7 Sonnet模型的一项核心功能,允许用户选择两种模式:
- 实时回答模式:像普通聊天机器人一样快速响应。
- 扩展思维模式:在回答前进行深度思考,并展示完整的“思维链”(Chain of Thought)。
技术特点:
- 混合推理模型:Claude 3.7 Sonnet是全球首个将实时生成与深度推理融合的AI模型,既能快速回答简单问题,又能像人类一样对复杂问题“多想一想”。
- 透明化思考过程:在扩展模式下,用户可以看到模型如何拆解问题、调用知识库、验证逻辑,甚至自我纠错。
- 可控的思考成本:开发者可通过API设置模型最多消耗的“思考时间”(以token数量衡量),平衡速度与质量。
举个栗子🌰:
当被问及“如何用p5.js编写复杂的布料模拟代码?”时,Claude会先分解问题(如物理模拟原理、代码框架设计),再逐步生成代码片段并测试,最终给出可行方案。而其他模型(如Grok 3)可能直接失败。
二、为什么这项技术重要?
1. 提升可信度与调试效率
传统AI的答案像“黑箱”,用户难以判断其可靠性。而Claude的可见思考过程让开发者能:
- 检查逻辑漏洞,比如代码中的潜在错误。
- 理解模型决策依据,避免盲目依赖结果。

2. 性能大幅跃升
在扩展思维模式下,Claude 3.7 Sonnet的表现显著优于前代模型:
- 编码能力:在真实编程测试SWE-Bench中,准确率达62.3%,远超OpenAI和DeepSeek的49%左右。
- 复杂任务处理:在模拟零售交互的TAU-Bench测试中,得分81.2%,领先OpenAI的73.5%。
- 拒绝率降低:对无害请求的误判减少45%,回答更人性化。
3. 推动人机协作新模式
Anthropic同步发布了编程工具Claude Code,开发者可通过自然语言指令让AI直接修改代码库、运行测试甚至提交到GitHub。早期测试显示,原本需要45分钟的任务,Claude Code可一次性完成。
三、技术背后的挑战与争议
1. 安全与隐私的平衡
虽然Claude展示了更多思考细节,但出于安全考虑,部分敏感内容(如涉及有害信息的推理)会被自动编辑。这与Anthropic长期强调的AI安全理念一致。
2. 高成本可能限制普及
Claude的定价是竞品的3-6倍,扩展思维模式消耗的token更多,可能劝退预算有限的用户。
3. 学术竞赛成绩的取舍
尽管Claude在现实任务中表现优异,但在数学竞赛(如AMIE 2024)中仍落后于部分模型。Anthropic明确表示,他们更关注企业级应用优化,而非“刷分”。
四、未来展望:AI会取代人类吗?
Anthropic的“可见扩展思维”不仅是一次技术突破,更揭示了AI发展的两大趋势:
- 透明化:用户需要理解AI的决策逻辑,而非被动接受结果。
- 协作化:AI将从“工具”进化为“协作者”,比如Claude Code正在重新定义编程工作流。
当然,这项技术也引发担忧:如果AI的思考能力持续接近人类,我们该如何确保其安全性?对此,Anthropic的答案是:通过安全对齐研究,从底层约束AI的行为。
结语:一场AI透明化的革命
Claude的“可见扩展思维”技术,让普通人也能窥见AI的思考过程。这不仅提升了技术的可信度,也为教育、科研、开发等领域提供了新工具。尽管面临成本和竞争压力,Anthropic的探索无疑为AI发展指明了方向——更智能、更透明、更安全。
参考资料
- Anthropic官方技术文档
- 本文部分数据来自新浪财经、网易、太平洋科技等媒体报道。
关注我,了解更多AI前沿技术解析!
976

被折叠的 条评论
为什么被折叠?



