自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 gpt-oss 报告解读

摘要:OpenAI发布两款开源推理模型gpt-oss-120b和gpt-oss-20b,基于Apache 2.0许可证,采用混合专家架构(MoE),支持128k上下文长度和工具调用功能。120b模型参数116.8B,20b模型20.9B,均经过MXFP4量化优化实现高效部署。训练数据聚焦STEM和编程领域,后训练强化了推理和工具使用能力。性能评估显示120b接近o4-mini水平,在数学、健康和多语言任务表现突出。安全评估表明其风险可控,未显著推进生物安全等高风险领域能力前沿,为开源社区提供了高性能基础模型

2025-08-06 14:16:11 1174

原创 Group Sequence Policy Optimization

GSPO算法,解决强化学习训练语言模型时的稳定性问题。相比GRPO的token级优化,GSPO采用序列级重要性采样,通过序列似然比定义、长度归一化等技术降低方差。实验显示GSPO在MoE模型训练中保持稳定,无需复杂策略即可收敛,在代码生成和数学推理任务中表现优异。该算法简化了RL基础设施,已成功应用于Qwen3系列模型,为大规模RL训练提供稳健基础。未来将优化长序列任务并解耦训练-推理架构。

2025-07-25 18:09:21 625

原创 通信原语学习记录

集合通信,作为并行计算中的核心概念,指的是在一组进程之间进行的协调通信模式,确保所有参与者都能高效地交换信息。这一领域的基石包括基本的通信动作,如数据的发送(Send)、接收(Receive)、数据的复制(Copy),以及关键的同步机制,如进程栅栏(Barrier)等。

2024-07-13 19:53:30 3682 1

原创 IDEA中maven项目右侧不显示maven的解决方法

IDEA打开maven项目右侧不显示maven解决方法

2022-06-08 00:09:20 1491

原创 STK11.2 计算卫星A关于卫星B的相对位置 (三维和二维)

STK11.2 输出卫星A关于卫星B的相对位置一、创建卫星A、B1.创建场景2.插入卫星A、B二、以卫星B为中心建立VVLH坐标系三、创建B指向A的矢量四、创建新的报告格式五、生成Report一、创建卫星A、B1.创建场景打开STK,点击Creat New Scenario,设置场景时间,点击OK。2.插入卫星A、B点击Insert,选择Satellite,选择From TLE File,选择卫星A的TLE文件,点击打开。点击Time Period设置卫星period时间,点击OK,点击Inse

2021-06-30 21:28:21 7864 10

STK中文学习资料.rar

STK覆盖模块教材.pdf STK链路模块教材.pdf STK培训教材.pdf STK培训教材.ppt STK通信模块教材.pdf STK与C_的集成开发研究.pdf

2021-07-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除