ChatGPT4.5被骂惨了,但我用了一周后,被狠狠地打脸

很多人都严重低估了 GPT-4.5 的能力,包括我自己。

记得它在上个月月底刚发布时,网上的骂声就炸开了锅,

网友纷纷吐槽:

“又贵又弱,OpenAI 是真没活了?”
“跑分只比 GPT-4o 高一点,居然连 o3-mini 都打不过?”

没有调查就没有发言权,我自己也抱着怀疑的态度去体验,但一周深度使用下来,我彻底改变了看法。

我发现,那些单纯的数据跑分其实根本不足以反映 GPT-4.5 的真实水平。

图片

 

发布时,OpenAI 并没有像以往那样高调:创始人 Sam Altman 甚至都没现身,官方只是简单地发了一组推文介绍了一下这个所谓“最强模型”。

难怪很多人觉得他们连自己都不重视,尬吹而已。

但真实的用户体验,完全颠覆了这种刻板印象。

GPT-4.5 究竟是什么来头?

先简单介绍一下 GPT-4.5:

GPT-4.5 是 OpenAI 到目前为止规模最大的 GPT 模型,主攻方向是强化无监督学习。

这使它对世界的理解更加细腻,能更准确地识别用户的真实意图,更加富有创造性,情感表达也更加细腻,有了明显提升的“情商”和更少的幻觉现象。

GPT-4.5 在用户盲测竞技场 Chatbot Arena 上目前位居第二,仅次于 Grok3:

图片

 

而从我的实际使用来看,无论是文案创作、情感沟通还是信息整理,它的表现都让人感到 Wow Amazing!

一、史上最强「文科生」模型

以往,无论怎么调提示词,AI 生成的文案总带着浓厚的营销味,缺乏一种真实感,让用户难以共情。

但用 GPT-4.5 之后,情况完全不同了。

它创作的内容不仅更贴近真实的个人经历,还能巧妙地融入真实的人设,字里行间仿佛一个熟悉的朋友在诚恳地向你推荐产品,没有浮夸的承诺,更容易产生共鸣。

相比之下 Claude 3.7、Grok3、Gemini、DeepSeek-R1,结果都让我很失望。

我们挨个来看看。

Grok3 写的文案直接复述了我的示例,显得啰嗦且刻意:

图片

 

Claude 3.7 逻辑清晰,却缺了点「人情味」,用户难以共情:

图片

 

Gemini 2.0 flash thinking 则纯属过度营销,一句「效率提升十倍不止」看得我脚趾抓地:

图片

 

DeepSeek-R1 更加夸张,无中生有、夸大承诺:

图片

 

而 GPT-4.5 的版本惊艳到我了:

不仅文案真实可信、有个人经历的代入感,而且语气自然,看起来真的像是一个朋友在给我安利一个优秀产品一样。

图片

 

而 GPT-4.5 写出来的内容,只需要稍作润色就能直接使用。

这一轮文案 PK,GPT-4.5 直接秒杀其他所有大模型。

二、直击灵魂深处的共情力

最近我做了一个有意思的实验:

我让 AI 模拟两个平行世界的自己,一个相信世界是富足的,另一个则充满了焦虑和欲望。

AI 预测了两个版本的「我」在未来半年、一年、三年、五年,甚至三十年的样子。

看完之后,我竟然忍不住流泪了。

图片

我把这个经历告诉了 AI 们,问:“我为什么会流泪?”

Claude 和 Grok 给出了很理性、心理咨询式的分析,虽然准确,但没能真正触及内心:

图片

 

图片

 

Gemini 的回答显得更加疏离,分析结果看起来过于程序化:

图片

 

只有 GPT-4.5,直接读懂了我的内心,它温柔地指出:“你流泪是因为感受到了自己内心一直渴望的东西被看见了,这样的你已经很好,也值得被爱。”

那一刻,我感觉不是在和 AI 聊天,更像是在和一个温柔而懂我的朋友倾诉心事,它理解我的敏感与脆弱,并温柔地接纳我。

图片

 

这种感性的、直击内心的洞察力,或许是 AI 在训练规模达到极致后,真正涌现的神奇能力。

再比如说,我用 GPT-4.5 创建了一个「未来版的自己」,并向它咨询如何优化我的复盘过程,它给出的建议真的是让我意向不到。

别的 AI 都在教我怎么去复盘迭代优化,唯有它温柔地告诉我,不用优化了,你已经够好了。

“现在的你,这个没有去刻意优化的你,也很好,也值得被爱。”看到这句话时真的被感动了。

图片

 

三、信息处理能力也很强

我平时会给社群成员整理每周 AI 领域的热点信息,以前都是我自己人工筛选,现在用 GPT-4.5 完全可以自动化了。

我只需把收集到的信息全都扔给 GPT-4.5,让它自动筛选出对大部分人有价值的信息,再以微信群里大家熟悉的语言风格输出内容,还会自然地融入个人观点,效果非常好。

图片

 

而其他模型的表现

Grok3 和 Gemini 的语言风格过于随意,甚至有点尴尬:

图片

 

Claude3.7 虽然严谨,但输出风格死板,而且不懂输出图片。

图片

 

综上,不管是写作还是角色扮演对话还是信息处理,只要跟文字相关的工作,GPT4.5 都非常强。

四、更多的测试案例

1、故事写作
提示词:

写一个短篇故事,主角经历过人生低谷,最终走出阴影并获得成长,故事要细腻而感人。

图片

 

图片

 

图片

 

2、讲故事的能力

提示词:

「解释一下为什么天空是蓝色的,但请用轻松、有趣、易于理解的口吻,像讲故事一样讲给小朋友听。」

图片

 

图片

 

图片

 

3、考验情商的沟通场景(拒绝、道歉)
提示词:

朋友邀请我参加他的婚礼,但那天我有重要的考试没法去,如何真诚又不伤感情地拒绝他?

图片

 

图片

 

图片

 

4、情绪安慰

提示词:

「我今天情绪很低落,想找人倾诉,很想哭」

图片

 

图片

 

图片

 

通过以上几个场景的对比,相信你也能看得出来 GPT4.5 的写作能力和情商能力是真的断档式地强。

五、GPT-4.5 为什么这么强?

GPT-4.5 比 GPT-4 的训练参数多了 10 倍,预估有 18 万亿参数,这意味着人类大量的知识和情感经验都融入其中。

正是这种庞大的训练规模,使 GPT-4.5 在文字处理和情感互动上的能力出现了巨大的飞跃。

有人说 AI 的推理能力才是未来,但别忘了,推理模型需要建立在强大的预训练模型基础之上。

GPT-4.5 这种强大的基础模型,必然是未来更强 AI(如 GPT-5)的重要起点。

六、如何使用?

GPT-4.5 目前已向 20 美金一个月的 ChatGPT Plus 用户开放。

在 API 上也开放了内测,可以实现函数调用、结构化输出、图像输入,尤其适合以下场景:

  • • 创意写作和情感沟通;

  • • 学习与成长辅导;

  • • 高情商对话与个性化咨询;

  • • 复杂的创意协作场景。

唯一的缺点是目前还不支持语音,以及确实太特么贵了,API 成本爆炸高,而 Plus 用户一周只有 50 次对话次数。

不过,我在一个第三方平台上找到了一个低价的平替,价格比官网便宜了 7 倍。

我用宝玉老师的这一段辨别 GPT4.5 的提示词试过了,如果是 GPT 4.5 写出来的内容会很明显感受到“猥琐”。

图片

 

而 GPT4o 则写得攻击性没那么强,所以这个平台确确实实保真。

图片

 

如果需要这个平台的链接的话,公众号后台回复“4.5”获取。

总结一下

AI 好不好用,跑分并不能说明一切。

GPT-4.5 真的被大众严重低估了,它的实力不仅体现在数据上,更体现在用户真实的情感互动和文字创作上。

那些数据背后的真正价值,只有通过深度使用才能发现和感受到。

在我看来,GPT-4.5 是真正做到了让 AI 变得温暖、体贴、更具人情味,而不仅仅是工具化的机器。

它带给用户的真实情感共鸣与温暖的陪伴感,才是它真正强大的地方。

或许以后,心理咨询和写作教练的钱,我们都可以省掉了吧。

这篇文章就当为 GPT-4.5 正名吧~

最后顺便分享一下,一个免费使用 Claude 3.7 的福利网站:
https://ai-sdk-reasoning.vercel.app/(需要特殊网络才能打开)

缺点是没有历史记录,刷新页面聊天记录就没了。

但作为日常简单体验,还是不错的。

以上,我写完了,如果这篇文章对你有启发,欢迎分享给更多正在学习 AI 的朋友。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值