开源编程模型第一!白山智算上线快手KAT-Coder-Exp-72B 1010模型

部署运行你感兴趣的模型镜像

目录

模型亮点介绍

白山云MaaS服务提供边缘极速AI体验!

在软件开发能力评测基准SWE-Bench Verified上,KAT-Coder-Exp-72B 1010模型取得了74.6%的领先成绩,刷新了开源模型的性能纪录。

近日,白山云科技旗下“白山智算”平台(http://ai.baishan.com/website/model-api)已正式上线快手最新发布的开源编程模型KAT-Coder-Exp-72B(白山智算平台模型ID:KAT-Coder-Exp-72B-1010),用户可免费调用体验。

模型亮点介绍

KAT-Coder-Exp-72B 1010是KAT-Coder模型强化学习的实验版本,基于快手自研SeamlessFlow 工业级强化学习框架,通过创新的数据平面架构实现了训练逻辑与Agent的完全解耦,成功支持多智能体和在线强化学习等复杂场景。

• Trie Packing:通过重新设计训练引擎与注意力内核,以及树形梯度修复权重机制,将共享前缀的正反向计算合并,实现了在树形轨迹上的高效训练,训练速度平均提升 2.5 倍,大幅增加了强化学习训练的吞吐量。

• 熵感知优势缩放:该方法对每个rollout样本计算策略熵,并将其归一化后用作优势的放大系数,对高熵样本放大优势,对低熵样本适度抑制。在保留GRPO组内优化结构的同时有效增强了策略探索性,改善了强化学习训练过程中探索-利用的平衡。

白山云MaaS服务提供边缘极速AI体验!

白山云大模型API服务提供预构建、开箱即用的LLM服务,只需一行代码用户即可完成模型切换与集成。基于白山全球边缘云架构进行就近推理,能够为用户带来<300ms的超低延时推理体验。

目前,平台已上架DeepSeek系列、通义千问系列、ChatGLM系列、KAT-Coder系列等多款大模型,并提供部分免费模型。

完成实名注册认证以及首次API调用的新用户,将获得白山智算送出的450元大模型API体验金!开发者可对比选择各类模型,以更简单易用、灵活高效的API调用方式迅速开启AI创新之旅。

您可能感兴趣的与本文相关的镜像

Seed-Coder-8B-Base

Seed-Coder-8B-Base

文本生成
Seed-Coder

Seed-Coder是一个功能强大、透明、参数高效的 8B 级开源代码模型系列,包括基础变体、指导变体和推理变体,由字节团队开源

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值