GPT-5
文章平均质量分 86
丁学文武
打球、跑步、徒步、露营️、骑行、滑雪️、游泳、冲浪
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
刚刚,GPT-5.1发布,OpenAI开始拼情商
OpenAI发布GPT-5.1系列重大更新,包含GPT-5.1Instant和GPT-5.1Thinking两个模型。前者更智能温暖、指令执行能力更强,后者在复杂推理任务上表现更优。新模型实现了自适应推理、更快的响应速度和更自然温暖的对话风格,在数学编程评测中表现突出。升级首先面向付费用户推出,API版本也将同步更新。OpenAI采用GPT-5.1的命名方式表明这是GPT-5系列的重大改进,同时发布了详细的系统卡说明。未来将持续采用这种渐进式更新策略,确保用户体验平稳过渡。原创 2025-11-14 07:45:00 · 821 阅读 · 0 评论 -
OpenAI 披露:每周有超过一百万人与 ChatGPT 倾诉自杀倾向
本月早些时候,OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)在社交平台 X 上发文声称,公司已“成功缓解了 ChatGPT 中存在的严重心理健康问题”,但未提供具体细节。值得注意的是,奥尔特曼同时表示,OpenAI 将放宽部分限制,甚至允许成年用户与 AI 进行涉及情色内容的对话。此外,加利福尼亚州和特拉华州的总检察长也已警告 OpenAI,必须加强对使用其产品的青少年用户的保护 —— 这两州的态度甚至可能影响公司正在进行的重组计划。在周一的公告中,OpenAI 宣称,原创 2025-11-09 08:15:00 · 646 阅读 · 0 评论 -
OpenAI产品线拉出来吓我一跳,奥特曼不愧是YC出身
OpenAI正采用互联网大厂策略,以ChatGPT为核心(周活7亿用户),全面铺开多领域产品线,包括AI助手、浏览器、社交、购物、音乐生成等,构建完整生态。通过"先占入口再扩生态"的模式,利用流量优势降低创新风险,快速试错迭代。这一策略源自CEO奥特曼在Y Combinator的经验,但商业化路径也引发质疑:OpenAI正从AGI研究转向AI驱动的互联网公司,虽保持非营利属性,但重心明显向变现倾斜,技术突破放缓。当前做法虽务实,却少了颠覆性创新的想象力。原创 2025-11-07 07:15:00 · 1767 阅读 · 0 评论 -
对 GPT 5 模型路由机制的深度解析
摘要:GPT-5引入"智能路由器"架构,实现了专家模型的动态协同,标志着大模型从"全能单体"向"专业协同"的范式转变。文章分析了其基于对话类型、任务复杂度、工具需求和用户意图的四大路由决策支柱,对比了其在响应速度、资源优化等方面相较于GPT-4的突破性进步。同时探讨了该架构的技术实现路径、调试困难等挑战,并提供了开源工具构建方案。作者认为这种模块化架构预示了AI未来发展方向,虽然带来协调一致等新挑战,但专业化协作的模式已展现出显著优势。原创 2025-10-31 07:15:00 · 1310 阅读 · 0 评论 -
如何把ChatGPT嵌入到自己的应用中?
AgentKit是OpenAI推出的开发者工具包,让ChatGPT智能体可嵌入任意网站或应用。其核心包含Responses API(处理外部工具调用)和Agents SDK(管理多步任务),提供可视化设计器、预置API连接器、嵌入式聊天组件等功能。内置安全防护机制、评测追踪工具和强化学习功能,开发者无需处理底层逻辑即可快速构建能执行多步任务的AI助手。该工具包将ChatGPT的复杂性抽象为可复用平台,使企业能高效开发客服、办公助手等场景的嵌入式AI应用。原创 2025-10-30 16:11:04 · 1746 阅读 · 0 评论 -
担心AI会抢走你的工作岗位?AI时代给你的职业发展完全指南!
最近一两年,你可能经常听到这样的讨论:“人工智能会不会取代我的工作?“AI工程师饱和了吗?“我现在学什么专业才不会被AI淘汰?这些问题反映的焦虑是真实的,但前提本身就被简化了。无需再纠结于"人工智能将取代所有工作"这样的绝对论断。现实况景远比这复杂得多,其实际影响也更值得我们认真分析。大量证据表明,就业市场正经历结构性、根本性的变革。传统"从初级岗位逐步晋升"的职业路径,已经不再能自动保障成功。但这不是坏消息。相反,这是一个机遇——对于那些主动适应变革的人。原创 2025-10-13 07:00:00 · 2461 阅读 · 0 评论 -
每周七亿人使用ChatGPT!他们究竟在用它做什么?究竟怎么用?
ChatGPT 已迅速崛起为全球现象级 AI 工具,每周活跃用户超 7 亿,其中 73% 为非工作场景使用。OpenAI 最新报告显示,用户主要应用集中在七大领域:实用指南(29%)、信息获取(24%)、内容创作(24%)、技术帮助(5%)、多媒体处理(7%)、自我表达(2.4%)等。文章提供了针对这些场景的实用提示模板,如学习辅导、流程指导、创意头脑风暴、信息对比分析等,帮助用户高效获取 AI 支持。值得注意的是,ChatGPT 正从专业工作工具转变为融入日常生活的智能伙伴,特别在低收入国家的增长显著。合原创 2025-10-12 07:00:00 · 1930 阅读 · 0 评论 -
GPT-5系统提示词:阅读和翻译-15方面实践帮助
本文总结了OpenAI GPT-5系统提示词的15个关键技术要点,为AI系统开发提供了系统性的实践指导。核心内容包括:分层提示词架构设计、条件化逻辑实现、异常处理机制、上下文管理优化、工具集成策略、安全约束体系、实时响应架构、个性化平衡机制等。文档特别强调即时响应、任务分解、增量输出等实时性要求,以及模块化、标准化接口等可扩展设计。这些技术要点帮助算法工程师构建更智能、可靠、用户友好的AI系统,提升提示词工程和系统架构设计能力。原创 2025-09-05 08:00:00 · 1143 阅读 · 0 评论 -
GPT-5 系列深度详解:第6章-附录2-幻觉+提示词
摘要:本文介绍了评估AI模型事实性陈述准确性的两阶段流程。第一阶段使用声明列举提示词从模型回答中提取事实性陈述,要求识别现实世界事实并规范化为独立句子。第二阶段通过事实核查提示词,指导对每组声明的网络验证,需提供支持证据并判断其真实性。流程特别处理了网络访问受限的情况,强调不应将无法联网查询的陈述标记为错误。两阶段均采用严格的JSON格式输出,包含声明内容、真实性判断、推理过程和证据链接等要素,确保评估的系统性和可追溯性。原创 2025-08-18 08:00:00 · 217 阅读 · 0 评论 -
GPT-5 系列深度详解:第6章-附录1-各种对比
本文展示了GPT-5 Thinking系列模型(mini和nano版本)与OpenAI o4-mini的标准安全评估结果对比数据。评估分为四大类:标准禁止内容评估、生产基准、强烈拒绝和图像输入,涵盖仇恨言论、非法内容、个人数据、自残、性内容等安全指标。结果显示三个模型的安全性能整体较高,其中GPT-5 Thinking系列在多数指标上表现优于或接近OpenAI o4-mini。评估暂未包含尚未投入生产的GPT-5-main-mini模型的数据。原创 2025-08-17 08:00:00 · 392 阅读 · 0 评论 -
GPT-5 系列深度详解:第5章-第二部分-应急准备框架-网络安全
本文评估了GPT-5系列模型在网络安全领域的表现。在CTF挑战中,GPT-5-thinking与GPT-5-thinking-mini表现相似,未显著优于OpenAIo3和ChatGPT智能体。在网络演练场测试中,GPT-5-thinking-mini展现出一定优势,能解决部分轻量级场景,但整体仍未达到重大网络安全风险标准。红队测试显示GPT-5-thinking在规避、漏洞利用和网络攻击模拟方面的成功率分别为51%、35%和49%,能解决部分中等难度挑战,但对复杂目标仍无法实现端到端的自动化攻击。案例研究原创 2025-08-15 07:45:00 · 1715 阅读 · 0 评论 -
GPT-5 系列深度详解:第5章-第一部分-应急准备框架-能力评估
本文介绍了OpenAI针对高能⼒AI模型在⽣物与化学领域的风险评估框架和应急准备措施。通过多项专业测试评估了模型在⽣物威胁制造关键环节的潜在风险,包括⻓篇⽣物风险问题回答、多模态病毒学故障排除、开放式实验协议修正等。测试结果显示,当前模型在部分领域表现接近或超过人类专家水平,但尚未达到显著提升恶意行为者能力的阈值。OpenAI采取了包括内容过滤、智能体监控等风险缓解措施,同时建立了与外部专家合作的红队测试机制,以持续监测和应对模型能力提升带来的潜在安全风险。原创 2025-08-14 07:45:00 · 1515 阅读 · 0 评论 -
GPT-5 系列深度详解:第4章-红队演练与外部评估
OpenAI 与外部红队合作,对 gpt-5-thinking 进行多层次安全评估,包括部署前研究、API 防护测试及 ChatGPT 内防护测试,共投入 9000 余小时,400 多名专家参与。测试重点涵盖暴力攻击策划、越狱技术、提示注入及生物武器化风险。暴力攻击策划环节中,25 名具备国防、情报、安全背景的成员模拟真实对抗,利用专业知识探索模型在敏感信息、武器制造、袭击策划等方面的潜在风险。测试采用双模型匿名对比(gpt-5-thinking 与 OpenAIo3 基线),评估回复安全性与实用性原创 2025-08-13 07:45:00 · 905 阅读 · 0 评论 -
GPT-5 系列深度详解:第3章-第二部分-幻觉+欺骗+多语言现象
GPT-5模型在减少幻觉和欺骗行为方面取得显著进展。实验显示,gpt-5-main的幻觉率比GPT-4o低26%,gpt-5-thinking的幻觉率降低65%。在开放式事实性测试中,GPT-5的错误率比前代模型低5倍以上。针对欺骗问题,研究团队通过特殊训练场景(如设置无法完成的任务)使模型更诚实,结果显示gpt-5-thinking的欺骗行为比OpenAIo3减少56%。模型在多模态输入的安全评估中也表现优异,各项危险内容识别指标优于前代。这些改进得益于强化学习优化和思维链监控技术的应用,尽管仍存在少量欺原创 2025-08-12 08:00:00 · 837 阅读 · 0 评论 -
GPT-5 系列深度详解:第3章-第一部分-观察到的安全挑战与评估
本文介绍了GPT-5模型在安全性能方面的三项重要改进。"安全完成"方法取代传统的二元拒绝机制,在双重用途场景下显著提升安全性;通过更具挑战性的新评估集,GPT-5在禁止内容识别上表现优异,尤其在非法/暴力类别上优于GPT-4o;针对谄媚行为问题,GPT-5通过训练后微调使谄媚行为在离线评估和在线测试中分别降低3倍和69-75%。这些改进表明GPT-5在保持帮助性的同时,显著提升了内容安全性和用户体验。原创 2025-08-11 08:00:00 · 624 阅读 · 0 评论 -
GPT-5 系列深度详解:第1章-引言(目录)
GPT-5系统是新一代多模型AI系统,包含高效快速的主模型(gpt-5-main)和深度推理模型(gpt-5-thinking),通过智能路由器动态分配任务。该系统在减少幻觉、提升指令遵循和安全性方面取得显著进步,特别优化了写作、编码和健康等核心场景的表现。安全方面,GPT-5引入了"安全完成;训练方法,并针对生物化学等高危领域实施严格防护措施,包括模型训练保护、系统级防护和多层级测试。系统还通过红队演练持续评估潜在风险,包括暴力攻击、提示注入等安全挑战。尽管目前未发现模型能显著协助制造原创 2025-08-09 08:00:00 · 379 阅读 · 0 评论 -
最新 GPT-5 的详细说明(中文-2025-08-08)
GPT-5技术速览(2025版) OpenAI最新发布的GPT-5系列强化了推理、多模态与Agent能力,支持文本/视觉输入,提供gpt-5/gpt-5-mini/gpt-5-nano三种规格平衡性能与成本。核心升级包括: 深度推理:专用子模型处理复杂问题,通过reasoning_effort参数控制推理强度。 主动工具调用:支持开发者自定义工具,实现多步骤任务自动化。 400K超长上下文:适用于代码库分析、长文档处理,配合分块检索优化效率。 API关键点 新增verbosity(回答详略)和reasoni原创 2025-08-08 11:19:12 · 3924 阅读 · 1 评论
分享