自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 一夜狂更80+项,Claude Code 2.1 这波更新把全网都看嗨了!

功能的上线,以往在生成长技术文档或进行大规模代码审查时,一旦触及 Output Token 限制,输出就会戛然而止,需要人工干预。在之前的版本中,开发者每自定义一个 Skill(技能),都需要重启整个 Claude Code 才能生效。,模型就会在所有的交互中默认使用中文回复,彻底解决了中英文夹杂的沟通痛点,让交互体验更加流畅自然。在此之前,为了让 Claude 稳定输出中文,用户往往需要在每次 Prompt 中强调语言要求。在以前,一旦 AI 进行大规模重构出现错误,恢复现场往往需要耗费大量时间。

2026-01-09 18:37:10 442

原创 Claude Code Skills到底怎么用?大家看这篇文章就够了

最近两周,我的信息流被Claude Code Skills刷屏了。从AI爱好者的小圈子传开,现在连不太关注技术的朋友都在问:"Claude Code Skills是什么?我需要学吗?这个现象本身就很有意思。通常一个开发工具火起来,要么是因为解决了某个痛点,要么是因为降低了某个技术壁垒。Claude Code Skills两者都做到了。为什么这么火?有几个很实际的原因——如果你也好奇这是什么,或者想知道怎么用,这篇文章就够了。

2026-01-08 18:32:40 472

原创 GPT-5.2遭全网群嘲,原因竟然是不够人性化!

但SimpleBench(一个测常识推理的2024年基准),出来,GPT-5.2得分竟然低于Claude Sonnet 3.7,那是一年前的模型。有人想转录Ray Kurzweil的哲学论文(纯学术内容),GPT-4o到GPT-5.2全部拒绝,借口是"内容不合适"或"版权问题"。最过分的是那个著名的"garlic有几个r"问题,GPT-5.2一本正经回答0个,被网友直接嘲讽"GPT-5.2 is AGI"。看o1、o3、GPT-5、GPT-5.2的走势,每一代模型都在变得更"不自然"。

2025-12-16 19:43:25 342

原创 Nano Banana 2曝光:4K画质,连微积分都会算

其中一致性和多场景衔接 相比前代模型更好,同一人物在不同姿势或场景下出现时,五官服饰细节依然保持一致,不会出现“前后变脸”的情况。最后给大家分享一个彩蛋,据说OpenAI为了再次狙击Gemini 3和Nano Banana 2的发布,会推出GPT-5.1。同时界面中的文字非常清晰、排版布局也符合Youube官网,甚至让我觉得直接是Youtube的官网。目前Media IO 悄悄下线了这个模型,所有返回都是404,只能期待这个月能如期发布了。,只不过最后放出的是2k分辨率还是4k分辨率,有待商榷。

2025-11-11 20:03:13 360

原创 百度新模型5.0-Preview文本能力国内第一全球第二,附上一手实测

同时第二句的反差也很有意思,(天上 vs. 地下,明亮 vs. 黯淡),还有意境上的反差(圣洁 vs. 污浊,完整 vs. 破碎)。更重要的是,它的剧本细节也远胜一筹:从更细致的人物介绍,到台词中大量关于动作和表情的描写,这些都是Claude版本所欠缺的。这次对决,差距就比较明显了,文心不仅给出了三个方向的方案,每个方案都有详细的逻辑支撑,有些Slogen读起来还不错。“勾了他们家人的魂,索了他们家人的命”、“说得比唱得还好听”、“这嘴脸,和那卖人血馒头的,又有什么分别?先说剧本,两者都完成得很好。

2025-11-11 12:04:56 642

原创 一手实测kimi K2 Thinking,它依旧被这几道题难住了

1、 一条街上有五座不同颜色的房子,每座房子住着不同国籍的人,每个人有不同的职业,喝不同的饮料,养不同的宠物。同样这道题对于我们来说非常简单,但对大模型的难度可不一般,此前多款顶尖模型拜倒在这道题的石榴裙下。K2 Thinking同样没看出图片中的爱心图标,它的回答是“一个圆形的图案漂浮在背景之上”。为了防止之前的题目会训练过,所有我们在“strawberry”的基础上,多在了6个“r”。由于现在的模型的能力越来越强,并且有很多变量的存在,简单的题目已经无法测出模型的能力了。

2025-11-10 14:01:28 936

原创 百川发布M2 Plus,医疗幻觉率比DeepSeek低3倍!

原始层回答“事实是否存在”、证据层回答“结论是否一致”、指南层回答“行业如何规范”、实践层回答“医生应如何决策”、公共层回答“患者应如何理解”、真实世界层回答“是否存在新风险”。最终的结果就是,M2 Plus的每一个关键回答,都会像写论文一样,清清楚楚地附上参考文献和来源,让你随时可以查证。这六个源头像一个金字塔,从最底层的4000多万篇医学论文,到药监部门公告和真实世界的研究数据,一层比一层精炼。同时,它还内置了内置“证据评估器”,能自动评估证据的可信度,优先采用最高等级的证据。

2025-10-27 18:03:31 882

原创 重磅!OpenAI首款AI浏览器ChatGPT Atlas正式上线(附下载体验方式)

penAI正式发布首款AI原生浏览器ChatGPT Atlas,基于Chromium开发,界面与传统浏览器类似。核心功能包括AI侧边栏、浏览器记忆和智能体模式,支持付费用户实现自动化操作。目前已在macOS上线,其他平台版本即将推出。

2025-10-23 19:34:42 1649

原创 免费,使用gemini2.0多模态功能,限时可用

想不到,OpenAI 12天直播的主角是谷歌!这几天,谷歌可算出了彻彻底底出圈了,前脚推出量子计算机谷歌推出量子芯片Willow,后脚又宣布推出Gemini 2(目前Gemini 2 flash可用)。你以为完了?还有!Google又发布了它们的AI视频模型——Veo2(比Sora强),还直接发了他们改进版的AI绘图Imagen 3模型。Google这一波操作下来,直接把OpenAI按倒地上摩擦。OpenAI这波12天的直播,直接变成Google的营销背景板。

2024-12-23 11:41:47 3237

原创 谷歌正式推出Gemini 2,超越满血版o1(附Gemini 2订阅方法)

没有等到ChatGPT 4.5,居然等到了谷歌的Gemini 2.0。在今日凌晨不到一点时,谷歌CEO劈柴、DeepMind CEO哈萨比斯、DeepMind CTO Kavukcuoglu三位大佬联手官宣:新一代原生多模态模型Gemini 2.0 Flash正式发布!不过目前大家还用不了正式版的Gemini 2.0,谷歌表示已经将2.0版本提供给了一些开发者内测,正在迅速将其集成在Gemini和搜索等产品线中。

2024-12-23 11:13:14 2141

原创 如何评价新版的Claude-3.5 sonnet?一篇文章告诉你

如果单从能力上来看,一人之下,万人之上,仅次于o1模型。如果把Claude最新推出的Computer Use单拎出来的话,绝对的大拇哥,No.1。不同于国内模型玩文字游戏,最新版的Claude-3.5 sonnet自推出以来,被众多网友以及机构进行实测。得出的结论:仅次于o1-preview模型。文章尾还帮大家总结了四种果内使用Claude的方法。

2024-12-11 17:49:58 6047

原创 正常长期使用GPT-4o的方法,3种方法,总有适合你的

不会不会吧,都2024年12月份了,居然还有朋友不知道如何开通GPT的会员。估计大家在开通GPT会员时,要么就是魔法不行,要么就是没有海外支付方法,无法开通。前者不好在这里讲,大家自己想办法搞定,这篇文章主要是分享如何解决海外支付难题。

2024-12-11 11:08:37 3737

原创 OpenAI的大期货Sora正式发布,Sora使用要如何使用

相较于2月的原版Sora,他们今天带来了更高级的加速版Sora Turbo,更快,更强,生成效果更好。这运镜,这转场,绝对是我目前见过最丝滑的,如果你跟我说这是某个电影的片段,我也会这样觉得。

2024-12-10 17:20:38 1099

原创 OpenAI直播第一弹,满血版o1上线,国内可用

感觉第一天只是小试牛刀,后面应该有大的!3.1 直接去订阅(Plus和Pro都能升级)如果你没有海外信用卡订阅ChatGPT Plus,可以在wildcard平台申请一张海外支付卡片,然后用它去进行订阅操作。3.2 国内直连镜像(适合尝鲜的朋友)前面这种方法只适合能解决网络限制的朋友,如果你搞不定魔法,可以去2233.ai体验满血版o1。今天刚起床,打开o1,就发现已经可以使用满血版o1了,跑了几组,发现效果还不赖。

2024-12-06 15:33:04 949

原创 OpenAI 12天直播,原来是要发布这些东西

有网友统计,距离OpenAI公布Sora已过去了294天,距离公布视觉功能(Advanced voice mode - vision)已过去了205天,o1也仅仅只是一个预览版,满血版至今没有兑现。随后返回到wildcard,进入【ChatGPT一键升级】页面,把刚复制的链接填写进去,最后点击一键升级,ChatGPT的会员开通了。根据以往的规律,如果这些新功能,只能是Plus用户才能体验,所以有需要的话,赶紧提前订阅起来!还有网友爆料,OpenAI将推出全新的页面,Canvas将和AI搜索一样,内置!

2024-12-06 10:19:20 1239

原创 Claude和ChatGPT到底选择谁?用真实数据对比

关于“Claude和ChatGPT到底选择谁的问题”,如果是放到2个月前,我或许会毫不犹豫选择ChatGPT,不过最近Claude的一顿更新,让我一下子难以做出选择。有人说ChatGPT是理科生,在数学,逻辑推理能力更强,而说Claude是文科生,在写作方面表现更强。可事实真的如此吗?下面我将对Claude 和ChatGPT 两个模型的会员版进行深层次全面的对比,如果大家还没有订阅,可以看我之前的文章,里面详细的介绍了ChatGPT和Claude的注册订阅教程。

2024-11-19 11:06:51 2509

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除