内容源自公主号计算机科研圈
开源赛道也是热闹了起来。
就在深夜,字节跳动 Seed 团队正式发布并开源了 Seed-OSS 系列模型,包含三个版本:
-
Seed-OSS-36B-Base(含合成数据)
-
Seed-OSS-36B-Base(不含合成数据)
-
Seed-OSS-36B-Instruct(指令微调版)

-
Hugging Face 地址:https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Instruct
-
项目地址:https://github.com/ByteDance-Seed/seed-oss
Seed-OSS 使用了 12 万亿(12T)tokens 进行训练,并在多个主流开源基准测试中取得了出色的表现。
这三个模型均以 Apache-2.0 许可证发布,允许研究人员和企业开发者自由使用、修改和再分发。
主要特性:
-
灵活的推理预算控制:允许用户根据需要灵活调整推理长度。这种对推理长度的动态控制能力,可在实际应用场景中提升推理效率。
-
增强的推理能力:在保持平衡且优秀的通用能力的同时,针对推理任务进行了特别优化。
-
智能体能力:在涉及工具使用和问题解决等智能体任务中表现突出。
-
研究友好:考虑到在预训练

最低0.47元/天 解锁文章
479

被折叠的 条评论
为什么被折叠?



