本文是LLM系列文章,针对《Code Llama: Open Foundation Models for Code》的翻译。
Code Llama:代码的开放基础模型
摘要
我们发布了Code Llama,这是一个基于Llama 2的大型代码语言模型系列,提供了开放模型中最先进的性能、填充功能、对大型输入上下文的支持,以及编程任务的零样本指令跟随能力。我们提供多种风格以涵盖广泛的应用程序:基础模型(Code-Lama)、Python专业化(Code-LAMA-Python),以及分别具有7B、13B和34B参数的指令遵循模型(CodeLlama-Directive)。所有模型都是在16k个token的序列上训练的,并在高达10万个token的输入上显示出改进。7B和13B代码Llama和代码Llama-指令变体支持基于周围内容的填充。Code Llama在几个代码基准测试中达到了开放模型中最先进的性能,在HumanEval和MBPP上的得分分别高达53%和55%。值得注意的是,Code Llama-Python 7B在HumanEval和MBPP上的性能优于Llama 2 70B,我们所有的模型在MultiPL-E上的性能都优于其他所有公开可用的模型。我们在允许研究和商业使用的许可证下发布Code Llama。