Anthropic推出混合推理模型：Claude 3.7 Sonnet,“可见扩展思维”技术,让AI像人类一样思考

最新推荐文章于 2025-03-18 13:48:16 发布

原创最新推荐文章于 2025-03-18 13:48:16 发布 · 641 阅读

·

12

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #claude3.7 #claude

Github开源项目专栏收录该内容

32 篇文章

订阅专栏

Anthropic推出“可见扩展思维”技术：让AI像人类一样思考，小白也能看懂的深度解析

在这里插入图片描述

引言：AI的“思考”过程终于可见了！

你是否曾好奇，像ChatGPT这样的AI在回答问题时，内部究竟是如何“思考”的？最近，Anthropic公司推出的Claude 3.7 Sonnet模型给出了答案！通过“可见扩展思维”（Visible Extended Thinking）技术，Claude首次向用户展示了AI生成答案的完整思考路径，就像人类写草稿一样逐步推演。本文将从技术原理、实际应用和未来影响三个方面，带小白用户看懂这项革命性技术。

一、什么是“可见扩展思维”？

简单来说，这是Claude 3.7 Sonnet模型的一项核心功能，允许用户选择两种模式：

实时回答模式：像普通聊天机器人一样快速响应。
扩展思维模式：在回答前进行深度思考，并展示完整的“思维链”（Chain of Thought）。

技术特点：

混合推理模型：Claude 3.7 Sonnet是全球首个将实时生成与深度推理融合的AI模型，既能快速回答简单问题，又能像人类一样对复杂问题“多想一想”。
透明化思考过程：在扩展模式下，用户可以看到模型如何拆解问题、调用知识库、验证逻辑，甚至自我纠错。
可控的思考成本：开发者可通过API设置模型最多消耗的“思考时间”（以token数量衡量），平衡速度与质量。

举个栗子🌰：
当被问及“如何用p5.js编写复杂的布料模拟代码？”时，Claude会先分解问题（如物理模拟原理、代码框架设计），再逐步生成代码片段并测试，最终给出可行方案。而其他模型（如Grok 3）可能直接失败。

二、为什么这项技术重要？

1. 提升可信度与调试效率

传统AI的答案像“黑箱”，用户难以判断其可靠性。而Claude的可见思考过程让开发者能：

检查逻辑漏洞，比如代码中的潜在错误。
理解模型决策依据，避免盲目依赖结果。

2. 性能大幅跃升

在扩展思维模式下，Claude 3.7 Sonnet的表现显著优于前代模型：

编码能力：在真实编程测试SWE-Bench中，准确率达62.3%，远超OpenAI和DeepSeek的49%左右。
复杂任务处理：在模拟零售交互的TAU-Bench测试中，得分81.2%，领先OpenAI的73.5%。
拒绝率降低：对无害请求的误判减少45%，回答更人性化。

3. 推动人机协作新模式

Anthropic同步发布了编程工具Claude Code，开发者可通过自然语言指令让AI直接修改代码库、运行测试甚至提交到GitHub。早期测试显示，原本需要45分钟的任务，Claude Code可一次性完成。

三、技术背后的挑战与争议

1. 安全与隐私的平衡

虽然Claude展示了更多思考细节，但出于安全考虑，部分敏感内容（如涉及有害信息的推理）会被自动编辑。这与Anthropic长期强调的AI安全理念一致。

2. 高成本可能限制普及

Claude的定价是竞品的3-6倍，扩展思维模式消耗的token更多，可能劝退预算有限的用户。

3. 学术竞赛成绩的取舍

尽管Claude在现实任务中表现优异，但在数学竞赛（如AMIE 2024）中仍落后于部分模型。Anthropic明确表示，他们更关注企业级应用优化，而非“刷分”。

四、未来展望：AI会取代人类吗？

Anthropic的“可见扩展思维”不仅是一次技术突破，更揭示了AI发展的两大趋势：

透明化：用户需要理解AI的决策逻辑，而非被动接受结果。
协作化：AI将从“工具”进化为“协作者”，比如Claude Code正在重新定义编程工作流。

当然，这项技术也引发担忧：如果AI的思考能力持续接近人类，我们该如何确保其安全性？对此，Anthropic的答案是：通过安全对齐研究，从底层约束AI的行为。

结语：一场AI透明化的革命

Claude的“可见扩展思维”技术，让普通人也能窥见AI的思考过程。这不仅提升了技术的可信度，也为教育、科研、开发等领域提供了新工具。尽管面临成本和竞争压力，Anthropic的探索无疑为AI发展指明了方向——更智能、更透明、更安全。

参考资料

Anthropic官方技术文档
本文部分数据来自新浪财经、网易、太平洋科技等媒体报道。

关注我，了解更多AI前沿技术解析！

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

云樱梦海 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。