Code Llama: Open Foundation Models for Code

最新推荐文章于 2025-09-12 02:42:27 发布

UnknownBody

最新推荐文章于 2025-09-12 02:42:27 发布

阅读量741

点赞数

CC 4.0 BY-SA版权

文章标签： llama 人工智能深度学习

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/132805640

LLM 日更专栏收录该内容

828 篇文章

已下架不支持订阅

本文介绍了Code Llama，一个基于Llama 2的大型代码语言模型系列，提供最先进的性能和编程任务解决方案。Code Llama包括基础模型、Python专业化模型以及指令跟随模型，适用于各种应用场景。在多个代码基准测试中表现出色，超越其他公开模型。

本文是LLM系列文章，针对《Code Llama: Open Foundation Models for Code》的翻译。

摘要

我们发布了Code Llama，这是一个基于Llama 2的大型代码语言模型系列，提供了开放模型中最先进的性能、填充功能、对大型输入上下文的支持，以及编程任务的零样本指令跟随能力。我们提供多种风格以涵盖广泛的应用程序：基础模型（Code-Lama）、Python专业化（Code-LAMA-Python），以及分别具有7B、13B和34B参数的指令遵循模型（CodeLlama-Directive）。所有模型都是在16k个token的序列上训练的，并在高达10万个token的输入上显示出改进。7B和13B代码Llama和代码Llama-指令变体支持基于周围内容的填充。Code Llama在几个代码基准测试中达到了开放模型中最先进的性能，在HumanEval和MBPP上的得分分别高达53%和55%。值得注意的是，Code Llama-Python 7B在HumanEval和MBPP上的性能优于Llama 2 70B，我们所有的模型在MultiPL-E上的性能都优于其他所有公开可用的模型。我们在允许研究和商业使用的许可证下发布Code Llama。