1. Grok 3

我用它生成了一个生成俄罗斯方块的代码,虽然还有问题,但是已经像那么一回事了。主要是它还不用电话卡去注册,挺好。
我就用X账号登陆的。
2. Claude 3.7 sonnet
是Anthropic公司刚刚推出的混合推理模型。
下面是公司新发的X,一种模型,两种思考模式:

我们来看它在一些基准测试中的结果:

包括研究生水平的推理,代码,多语言回答、数学等问题上都提升明显(不过我发现Deepseek R1在数学问题上竟然还是第一名)。而且看起来比不过Grok 3啊。
使用:
注册Claude账号要买国外手机号,手机号购买网站sms起码要充值2美元,我不干了。