见多识广1：试用Grok 3和Claude 3.7 sonnet

最新推荐文章于 2025-10-25 14:49:20 发布

原创最新推荐文章于 2025-10-25 14:49:20 发布 · 568 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#语言模型

部署运行你感兴趣的模型镜像

1. Grok 3

在这里插入图片描述

我用它生成了一个生成俄罗斯方块的代码，虽然还有问题，但是已经像那么一回事了。主要是它还不用电话卡去注册，挺好。
我就用X账号登陆的。

2. Claude 3.7 sonnet

是Anthropic公司刚刚推出的混合推理模型。
下面是公司新发的X，一种模型，两种思考模式：
X主页上的消息
我们来看它在一些基准测试中的结果：
在这里插入图片描述

包括研究生水平的推理，代码，多语言回答、数学等问题上都提升明显（不过我发现Deepseek R1在数学问题上竟然还是第一名）。而且看起来比不过Grok 3啊。

使用：
注册Claude账号要买国外手机号，手机号购买网站sms起码要充值2美元，我不干了。

您可能感兴趣的与本文相关的镜像

Qwen3-VL-30B

图文对话

Qwen3-VL

Qwen3-VL是迄今为止 Qwen 系列中最强大的视觉-语言模型，这一代在各个方面都进行了全面升级：更优秀的文本理解和生成、更深入的视觉感知和推理、扩展的上下文长度、增强的空间和视频动态理解能力，以及更强的代理交互能力

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

廿载风光同笑泪

关注关注

7
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Claude 3.7：无限思考模式上线，程序员集体失业倒计时？GPT-5连夜改代码，马斯克：Grok 3才是真顶流！

强化学习曾小健

02-27

1081

2025年2月25日，AI圈迎来“核弹级”更新——Anthropic正式推出Claude 3.7 Sonnet，号称“史上最智能”的混合推理模型，主打“无限思考”模式，既能秒回简单问题，又能像人类一样分步骤深度推理，甚至用10秒生成3287行代码、一键开发可玩性爆表的游戏，堪称“码农终结者”。更“嚣张”的是，Anthropic同步推出Claude Code代理编程工具，开发者只需在终端发号施令，AI就能自动搜索代码、编辑文件、运行测试、提交GitHub，连45分钟的手动操作都能压缩到瞬间完成。

2025年主流大模型全景对比：Grok、Claude、ChatGPT与Gemini的战场

最新发布

GY的的专栏

10-25

2002

本文系统分析了2025年四大主流大语言模型（Gemini、ChatGPT-4.5、Claude4Opus、Grok）的技术特点与适用场景。Gemini具有原生多模态优势，ChatGPT-4.5擅长复杂逻辑推理，Claude4Opus在医疗法律等垂直领域表现突出，Grok则以开源特性见长。文章提出企业选型需考量核心需求、资源约束和测试验证，并指出未来将向多模态模型、开源生态和垂直领域专业化方向发展。这些AI模型正成为推动企业数字化转型的核心引擎。

参与评论您还未登录，请先登录后发表或查看评论

一文读懂Grok 4发布会：四大天王Claude、OpenAI、Gemini和Grok轮流发布，争夺全球TOP1

猫头虎技术团队：授渔优于赠鱼，兴趣引领智慧，探索之乐尤显珍贵。商务合作+：Libin9iOak ，万粉变现+：优快云WF，猫头虎承诺每年免费为100名C站创作者做账号流量诊断服务！全网搜：猫头虎技术团队，点击文章底部名片或直接私信我一切皆可谈，快找虎哥！

07-11

5635

一文读懂Grok 4发布会：四大天王Claude、OpenAI、Gemini和Grok轮流发布，争夺全球TOP1,马斯克旗下xAI发布Grok 4，号称;全球最智能AI;，在多项专业测试中实现碾压式突破。Grok 4在HLE（人类最后考试）获得45%的高分，远超Gemini 2.5 Pro的21%；在ARC AGI v2推理测试中取得15.8%的历史性成绩。此外，它还在数学竞赛、编程、商业决策和生物医学等领域展现卓越表现。现场演示包括解决博士级数学难题、有机化学机制分析，以及实时市场预测和黑洞碰撞模拟。

史上最强AI对决结果曝光：Claude 3.7 Sonnet竟在这些领域碾压全场

weixin_44626085的博客

03-02

1021

当所有人还在为ChatGPT的进化速度惊叹时，一份来自全球开发者社区的实测报告突然刷屏。Claude 3.7 Sonnet以王者归来的姿态，在代码生成、多模态处理、逻辑推理三大战场全面碾压O3 Mini、DeepSeek R1和Grok 3。这场没有硝烟的战争，正在改写人工智能的势力版图…

Grok、Claude、ChatGPT、Gemini模型适用场景比较

GY的的专栏

10-25

1315

四大AI模型比较：Grok实时数据与推理适合科研和编程；Claude长文本处理出色，适合创意写作和代码优化；ChatGPT多功能且用户友好，适合创意营销和办公；Gemini性价比高，擅长多语言和长文本处理。建议根据预算和需求组合使用，注意隐私和专业领域审核。

三大顶流AI模型场景化横评：Claude3.7 vs GPT4.5 vs Grok3开发者该如何选？

awscloud的博客

03-04

3322

三大模型已形成差异化技术路线：Claude深耕可信AI，GPT构建生态壁垒，Grok突破实时边界。开发者应根据项目阶段的特性需求（原型设计/生产部署/技术预研）动态选择，未来混合使用多模型API将成为新常态。

横评Kimi K2、DeepSeek、Grok 4、Claude 4四款大模型，谁是真王者?

weixin_49199926的博客

07-14

2660

K2 正式发布。总参数 1T，激活参数 32B，直接开源，还能免费商用。参数一口气卷到万亿级，刷新了目前开源模型的记录。在一堆权威基准里，K2 拿到了开源模型的最好成绩，尤其在编程、工具调用、数学推理这几个方向，表现得非常硬。现在在Kimi官网默认使用的就是新模型 K2。API 也同步上线，支持 128K 长上下文。定价不高，输入每百万 tokens 4 元，输出 16 元，差不多是 Claude 成本的五分之一。

Claude3.7Sonnet模型更新了？国内如何使用Claude3.7Sonnet? 如何安装Claude Code或在Cursor里面体验Claude3.7Sonnet?

hellocode_的博客

02-26

7327

Claude 3.7总结体验下来：Anthropic发布的最新混合推理模型，具备即时响应和深度思考的能力，特别擅长编码和前端开发。抛开喜欢封号来说，我觉得真的很喜欢cluade,愿意为他扛大旗为它推广做金牌销售：命令行工具，允许开发者通过终端委托工程任务，显著提升开发效率。定价与性能：模型在所有Claude计划中可用，定价合理，性能在多个基准测试中领先。未来展望：Claude 3.7 Sonnet和Claude Code标志着AI系统在增强人类能力方面的重要进展。

【资料分享】LLM竞技场风云突变：Grok 3 vs Claude 3.7 vs DeepSeek-R1 vs GPT-4.5

2303_77200324的博客

03-06

1810

人工智能技术的迅猛发展推动了大语言模型（LLMs）的迭代升级，然而模型性能的评估却面临两大核心挑战：测试集污染（模型通过训练数据记忆答案）和评测维度单一（过度依赖技术指标或主观偏好）。在此背景下，LiveBench与LMSYS两大评测平台应运而生，分别从客观能力验证与用户体验洞察切入，构建了互补的评估体系，成为学术界与产业界的重要参考工具。

【深度分析】深度解析：Claude 3.7 Sonnet 凭什么成为 AI 编程的王者？

03-18

1197

当你沉迷于算法和公式时，可曾想过——那不过是理解世界的工具，而非世界的本质。数学，是我们解码宇宙的密钥，却永远无法替代亲身体验的真实。物理学诺奖得主理查德·费曼曾说：𝙈𝙖𝙩𝙝𝙚𝙢𝙖𝙩𝙞𝙘𝙨 𝙞𝙨 𝙖 𝙬𝙖𝙮 𝙤𝙛 𝙪𝙣𝙙𝙚𝙧𝙨𝙩𝙖𝙣𝙙𝙞𝙣𝙜 𝙩𝙝𝙚 𝙬𝙤𝙧𝙡𝙙, 𝙗𝙪𝙩 𝙞𝙩 𝙞𝙨 𝙣𝙤𝙩 𝙩𝙝𝙚 𝙬𝙤𝙧𝙡𝙙 𝙞𝙩𝙨𝙚𝙡𝙛.别让方程式代替了感受，别让数字模糊了双眼。放下计算器，去触

四大主流大模型(Claude/ChatGPT/Grok/Gemini)深度对比与选择指南！

Trb201013的博客

10-04

1645

本文对比了Claude 4、ChatGPT、Grok和Gemini四大AI模型的特性与优势。Claude擅长代码分析，ChatGPT是全能型AI，Grok专精实时数据，Gemini拥有最大上下文窗口。文章根据不同场景提供选择建议，帮助用户根据任务类型和预算挑选最适合的AI助手。

Grok3 Claude 3.7的编程能力太强了？Grok3 VS Claude 3.7大比拼

hellocode_的博客

03-05

1343

自从上周Grok3和Claude 3.7 Sonnet发布，我的 X 就被这玩意刷屏了好几天。

两步教你抢先体验claude3.7！便宜，快速，国内可用！

qq_40843986的博客

02-25

7894

本期只教大家怎么使用 claude3.7；可以自行选择等聊天工具；需要的话，可以看我往期的教程，或者直接在浏览器搜索（组合搜索）。

最新可用，免费使用Claude 的几种办法！（持续更新）

AIBox365的博客

05-09

3220

近期，公司重磅推出了全新旗舰模型，堪称当前代码能力的顶尖标杆，同时在其他各个领域表现同样卓越。这款突破性大模型独具匠心地融合了常规大语言模型与深度推理模型的优势，形成了一体化的智能架构。其创新之处在于能够根据任务需求灵活切换回答模式——既可快速响应常规查询，又能深度思考后给出精准解答。这种全新的设计理念更加贴近人类大脑的自然思维过程，标志着AI技术向更高智能层次的飞跃。如此强大的AI工具，究竟通过哪些渠道才能充分体验其卓越性能？

一分钟了解8大AI大模型的优缺点（有图有链接）平时工作如何选择？

m0_57124989的博客

03-02

1144

自从过年期间deepseek爆火以来，我一直主要使用的他，很直观的能感受到他的逻辑能力，和反应能力，另外他能很好的理解用户的思路，即使用户只发了很少提示词，这一点就很棒，另外他不会回答你不需要的东西，也会乱回答。他的代码能力在国内模型里应该是可以排第一的，这里指的是deepseek官网的模型70b，而非其他厂家部署的。例图不过deepseek的缺点也很明显，在使用的过程中经常会系统繁忙，如果让他分析一些紧急的任务可能直接就炸杠了。同时输出长度是有限制的。

ChatGPT4.5被骂惨了，但我用了一周后，被狠狠地打脸

suyuan2022的博客

03-16

1353

AI 好不好用，跑分并不能说明一切。GPT-4.5 真的被大众严重低估了，它的实力不仅体现在数据上，更体现在用户真实的情感互动和文字创作上。那些数据背后的真正价值，只有通过深度使用才能发现和感受到。在我看来，GPT-4.5 是真正做到了让 AI 变得温暖、体贴、更具人情味，而不仅仅是工具化的机器。

Claude 3.7 Sonnet AI 进化再升级！AWS Bedrock 最快实测

因果律的博客

02-25

1805

2025 年 2 月 25 日，Anthropic 发布 Claude 3.7 Sonnet，这是首个 “混合推理模型”，可切换思考模式。它能通过限制思考 “预算” 令牌数调节速度与质量，在编程等能力上表现出色，API 使用价格不变。同期发布的 Claude Code 是一款新型编码工具，其 GitHub 仓库已公开。Claude.ai 也开始支持连接 GitHub。作者试用发现，Claude 3.7 Sonnet 在扩展思考模式下成功解答复杂数学题，表现优于 Claude 3.5 Sonnet。此外，文中

Claude、Gemini、Grok三大AI模型全方位对比，7大场景实测帮你选对开发伙伴！

m0_74942241的博客

09-28

925

文章通过7个实际场景对Claude、Gemini和Grok三款AI聊天机器人进行了全面测试。Gemini在实时知识、幽默感和社交化回答方面表现最佳；Claude在创意、风格转换和批判性思维上更为突出；Grok在实用性和实际应用方面表现稳定。最终Gemini综合胜出，为不同需求的用户提供了选择参考。

三大AI模型实测：Claude3.7、GPT4.5与Grok3性能对比

2024年，人工智能语言模型的发展进入了新的高峰阶段，Anthropic的Claude 3.7、OpenAI的GPT-4.5以及Elon Musk旗下xAI团队推出的Grok-3成为当前最受关注的三大旗舰级大语言模型。这三款模型不仅在参数规模、训练数据和...

见多识广1：试用Grok 3和Claude 3.7 sonnet

目录

1. Grok 3

2. Claude 3.7 sonnet