本文是LLM系列文章,针对《Yi-Lightning Technical Report》的翻译。
摘要
本技术报告介绍了Yi-Lightning,我们最新的旗舰大型语言模型(LLM)。它取得了卓越的成绩,在聊天机器人竞技场上排名第六,在中文、数学、编码和硬提示等专业类别中取得了特别强劲的成绩(第二至第四名)。Yi Lightning利用了增强的混合专家(MoE)架构,具有先进的专家分段和路由机制,以及优化的KV缓存技术。我们的开发过程包括全面的预训练、监督微调(SFT)和基于人类反馈的强化学习(RLHF),在这些过程中,我们为多阶段训练、合成数据构建和奖励建模设计了深思熟虑的策略。此外,我们实现了RAISE(负责任的人工智能安全引擎),这是一个由四个部分组成的框架,用于解决训练前、训练后和服务阶段的安全问题。在我们可扩展的超级计算基础设施的支持下,所有这些创新都大大降低了训练、部署和推理成本,同时保持了高性能标准。通过对公共学术基准的进一步评估,Yi-Lightning展示了与顶级LLM的竞争表现,而我们观察到传统的静态基准结果与现实世界中动态的人类偏好之间存在显著差异。这一观察结果促使人们对传统基准在指导开发更智能、更强大的人工智能系统以用于实际应用方面的效用进行了批判性的重新评估。Yi Lig