- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 gpt-oss 报告解读
摘要:OpenAI发布两款开源推理模型gpt-oss-120b和gpt-oss-20b,基于Apache 2.0许可证,采用混合专家架构(MoE),支持128k上下文长度和工具调用功能。120b模型参数116.8B,20b模型20.9B,均经过MXFP4量化优化实现高效部署。训练数据聚焦STEM和编程领域,后训练强化了推理和工具使用能力。性能评估显示120b接近o4-mini水平,在数学、健康和多语言任务表现突出。安全评估表明其风险可控,未显著推进生物安全等高风险领域能力前沿,为开源社区提供了高性能基础模型
2025-08-06 14:16:11
1174
原创 Group Sequence Policy Optimization
GSPO算法,解决强化学习训练语言模型时的稳定性问题。相比GRPO的token级优化,GSPO采用序列级重要性采样,通过序列似然比定义、长度归一化等技术降低方差。实验显示GSPO在MoE模型训练中保持稳定,无需复杂策略即可收敛,在代码生成和数学推理任务中表现优异。该算法简化了RL基础设施,已成功应用于Qwen3系列模型,为大规模RL训练提供稳健基础。未来将优化长序列任务并解耦训练-推理架构。
2025-07-25 18:09:21
625
原创 通信原语学习记录
集合通信,作为并行计算中的核心概念,指的是在一组进程之间进行的协调通信模式,确保所有参与者都能高效地交换信息。这一领域的基石包括基本的通信动作,如数据的发送(Send)、接收(Receive)、数据的复制(Copy),以及关键的同步机制,如进程栅栏(Barrier)等。
2024-07-13 19:53:30
3682
1
原创 STK11.2 计算卫星A关于卫星B的相对位置 (三维和二维)
STK11.2 输出卫星A关于卫星B的相对位置一、创建卫星A、B1.创建场景2.插入卫星A、B二、以卫星B为中心建立VVLH坐标系三、创建B指向A的矢量四、创建新的报告格式五、生成Report一、创建卫星A、B1.创建场景打开STK,点击Creat New Scenario,设置场景时间,点击OK。2.插入卫星A、B点击Insert,选择Satellite,选择From TLE File,选择卫星A的TLE文件,点击打开。点击Time Period设置卫星period时间,点击OK,点击Inse
2021-06-30 21:28:21
7864
10
STK中文学习资料.rar
2021-07-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅