1.1k Star！天工Skywork-13B：性能全面超越LLaMA2、0门槛商用、消费级显卡进行部署和推理！

最新推荐文章于 2025-09-22 19:10:33 发布

原创

最新推荐文章于 2025-09-22 19:10:33 发布 · 1.9k 阅读

27 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

cover_image
原文链接：（更好排版、视频播放、社群交流、最新AI开源项目、AI工具分享都在这个公众号！）

1.1k Star！天工Skywork-13B：性能全面超越LLaMA2、0门槛商用、消费级显卡进行部署和推理！

🌟Skywork-13B-Base模型在3.2万亿个高质量多语言（主要是中文和英文）和代码数据上预训练，它在多种评测和各种基准测试上都展现了同等规模模型的最佳效果，包括Base、Chat、Math、MM模型及其量化版，支持用户在消费级显卡进行部署和推理。

Hello，大家好啊，我是Aitrainee，今天聊聊 国产开源大模型 ：Skywork-13B。去年 7 月，Meta 发布了
LLaMA2，以其强大的 性能和免费商用 的优势，迅速赢得了开发者和企业的喜爱。各个版本的 LLaMA2
微调成果不断涌现，让大模型领域的竞争局势快速变化。很多人认为，这波开源攻势会削弱那些闭源大模型厂商的“ 护城河
”，让中小企业和开发者有了更经济实惠的选择。不仅如此，国产大模型的开源力量也在加速追赶。然后，大模型开源仍面临 三大挑战 ：
首先，中文数据的稀缺和珍贵使得训练高质量模型变得困难；其次，模型训练的细节往往不公开， 限制了
开发者对模型的深度理解和优化；最后，模型开源在商用方面面临诸多限制，使得企业在实际应用中遇到许多障碍。而前不久，昆仑万维推出了 重磅开源项
** 目 ** ：天工 Skywork-13B 系列。为什么说重磅呢？因为 Skywork-13B 在多个基准测试（如 C-Eval，MMLU）中
全面超越 了 LLaMA2-13B。这次开源不仅包括 Skywork-13B-Base 模型、Skywork-13B-Math 模型，还有它们的
量化版模型。更厉害的是，昆仑万维还开放了一个600GB、150B Tokens的 高质量中文语料数据集 「Skypile/Chinese-
Web-Text-150B」，而且 全面开放商用，开发者无需申请，零门槛 就能用上。

▲ Model Scope

一键直达：

• Skywork-13B 下载地址（Model Scope）：https://modelscope.cn/organization/skywork• Skywork-13B 下载地址（Github）：https://github.com/SkyworkAI/Skywork• 技术报告：https://arxiv.org/pdf/2310.19341.pdf

模型结构

Llama模型有三个主要特点：首先，它使用RMSNorm代替传统的Layernorm，以保持训练的 稳定性
；其次，它使用SwiGLU激活函数而不是传统的ReLU；最后，它使用相对位置编码（RoPE等）而不是传统的绝对位置编码。实验结果表明，与GPT模型相比，
Llama模型不仅训练得更快，而且效果也更好。