程序员必看!ChatGPT深入研究功能实测,26.6%准确率碾压所有AI大模型

大家好,我是大头,职高毕业,现在大厂资深开发,前上市公司架构师,管理过10人团队!
我将持续分享成体系的知识以及我自身的转码经验、面试经验、架构技术分享、AI技术分享等!
愿景是带领更多人完成破局、打破信息差!我自身知道走到现在是如何艰难,因此让以后的人少走弯路!
无论你是统本CS专业出身、专科出身、还是我和一样职高毕业等。都可以跟着我学习,一起成长!一起涨工资挣钱!

chatGPT深入研究功能,不愧是AI届的扛把子

openAI一向是AI届的风向标,就如同手机都对标苹果,汽车都对标特斯拉,AI也都在对标chatGPT。

2025年2月2日,chatGPT发布了一项新功能,深入研究功能。当时是给Pro用户开放的,而现在,普通用户也有每个月5次的使用机会,大家可以体验一下。

效果确实很好,比思考要好用的多。

深入研究功能是一款能通过推理整合海量在线信息,并为您完成多步骤研究任务的智能代理。

这是一项新的代理功能,可在互联网上针对复杂任务进行多步骤研究。它可以在数十分钟内完成人工需要数小时才能完成的任务。

深入研究是OpenAI下一代能够自主为您完成任务的智能代理——只需要提供一个提示,ChatGPT 就会查找、分析并整合数百个在线来源,生成具有研究分析师水平的全面报告。

整合知识的能力是创造新知识的先决条件。因此,深入研究标志着向开发 AGI 这一更广泛的目标迈出了重要一步,我们很早就设想 AGI 能够产生新的科学研究成果。

下面有一个视频。

为什么要关注“深入研究”这类代理?

很多团队碰到的痛点是:信息太分散,人工查资料耗时。像我以前做竞品分析,常常需要翻几十篇白皮书,像剥洋葱一样慢。深入研究型智能代理能跨网页、PDF、图片检索并做推理。结果是什么?效率提升,但也伴随成本和风险。

举个生活例子:你叫外卖,速度快了,但偶尔会送错菜;同样,代理能快,但会“自信地撒谎”(hallucination)。这篇文章要帮你判断在哪些场景值得用,怎么安全地把它丢进工作流里。

该功能在查找需要浏览大量网站的细分、非直观信息方面尤为有效。深入研究只需一次查询,即可代您快速完成复杂耗时的网络调研,从而节省宝贵时间。深入研究可以独立发现、推理和整合来自整个网络的见解。

这项功能可以大大提升我们的效率,如果说第一代搜索引擎是百度、谷歌这种传统搜索引擎,第二代搜索引擎是chatGPT、Cluade、DeepSeek、Kimi这样的AI大模型,可以直接给出我们想要的答案,并且可以替我们搜索网页获得答案。那么深入研究就可以称得上是2.5代搜索引擎,它比单纯的AI大模型提供了更加优秀的搜索、整合、推理功能。

比如,你要分析一些竞品公司,那么可以直接用这个功能,整合这些竞品公司的各种数据,直接生成报表等,方便你进行分析查看,并且会给出分析建议。

核心能力与现状

  • 能力焦点:多步骤网页浏览 + PDF/图片解析 + Python 数据处理 + 引用回溯。就像请了个会翻书还会写脚注的助理。例子:把 200 页技术白皮书压缩成 3 页要点,像把大米煮成粥——省事但要把火候掌握好。
  • 可用度与配额(示例):Pro 用户优先开放,最初版本对 Pro 每月配额更高(示例:250 次轻量/100 次完整版等,具体以官方为准)。想象成健身房会员等级,高级卡能先用器械。
  • 准确率(内部评估示例):在某些基准上,深入研究模型表现显著优于传统模型(示例数值:模型在“人类终极测试”上得分 26.6%),但这并不等于“百分百可信”。就像高考分高不代表专业合格。

3 个适合交给“深入研究”的实战场景

初步情报收集与文献综述

场景:团队需要 24 小时内得到一份覆盖面广的背景报告。

  • 为什么合适:代理能并行抓取多个来源,做出结构化摘要。例子:要评估竞争对手 10 项专利时,代理能先做出专利矩阵,像把书架上的书按颜色分类一样快。
  • 风险与对策:引用格式可能有问题。对策:要求代理输出“原文句子 + 源链接 + 抓取时间”。
数据整合与可视化原型

场景:你需要把不同来源的表格合并并绘图支持决策。

  • 为什么合适:代理带 Python 工具可以帮你清洗、合并、画图。生活例子:像把冰箱里剩菜拼成一顿正餐,省时但口味需调。
  • 风险与对策:数据缺失或单位不一。对策:在代理任务里明确“校验步骤”与“异常报告”。
商业可行性与快速市场筛查

场景:想要短时间判断市场机会(如你刚才提供的 iOS/Android + 语言学习场景)。

  • 为什么合适:代理能产出候选市场清单并排序。例子:像速配 APP 的“初筛”,把 50 个市场筛成 5 个。
  • 风险与对策:法律或本地可用性(如某些地区无法访问服务)。对策:把“法律/可用性检查”作为单独子任务。

如何使用深入研究

在 ChatGPT 中,在消息编辑器中选择“深入研究”,然后输入您的查询。告诉 ChatGPT 您的需求——无论是关于流媒体平台的竞争分析,还是关于最佳通勤自行车的个性化报告。您可以附加文件或电子表格,为您的问题添加背景信息。一旦开始运行,侧边栏就会显示所采取步骤和所用资料来源的摘要。

深入研究可能需要 5 到 30 分钟才能完成工作,该时长可确保对网络信息进行充分深入的挖掘。在此期间,您可以离开或处理其他任务,研究完成后您会收到通知。最终输出会以报告形式显示在聊天工具中。在接下来的几周内,我们还将在这些报告中添加嵌入式图片、数据可视化和其他分析输出,以提供更清晰的解读视角和背景信息。

这里,可以明显发现深入研究的时长比较长,正常来说,我们直接使用AI工具是最快的,如果加上思考功能,会慢一些,而深入研究功能会更慢,当然了,效果也会更好。

与深入研究相比,GPT‑4o 是实时、多模态

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值