
1、OpenAI 更新「Supervised Fine‑Tuning」文档与 API 示范
OpenAI 今日在开发者官网发布新版 《Supervised Fine‑Tuning 指南》,首次将 o3、o4‑mini 等最新「Reasoning Models」纳入示例,并补充了批量数据验证、梯度累积、余弦退火学习率等进阶实践。
官方同时给出完整的 Python SDK 样例,演示如何一次性上传数万条 JSONL 训练集并在训练中实时监控损失曲线。指南强调 “微调仅影响行为,不会提升基础推理上限”,因此推荐配合 RFT 进行二阶段调优。文档还新增了 早停机制、训练中断续跑 与 模型/数据分离计费 政策说明:微调阶段仅按 GPU‑秒计费,推理阶段则按“基础模型费 + 细化权重存储费”双计价,以降低部署门槛。这意味着企业可在保障数据私有化的同时,以更低成本在私域落地专属模型。[1]
2、OpenAI 与微软重新谈判战略合作,为潜在 IPO 做准备
据 Reuters 报道,OpenAI 正与长期战略伙伴微软就股权与算力条款展开新一轮“高强度”谈判,目标是在 不削弱 Azure 深度绑定的前提下,为未来公开募股扫清监管与治理障碍。

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



