本文是LLM系列文章,针对《Code Llama: Open Foundation Models for Code》的翻译。
Code Llama:代码的开放基础模型
摘要
我们发布了Code Llama,这是一个基于Llama 2的大型代码语言模型系列,提供了开放模型中最先进的性能、填充功能、对大型输入上下文的支持,以及编程任务的零样本指令跟随能力。我们提供多种风格以涵盖广泛的应用程序:基础模型(Code-Lama)、Python专业化(Code-LAMA-Python),以及分别具有7B、13B和34B参数的指令遵循模型(CodeLlama-Directive)。所有模型都是在16k个token的序列上训练的,并在高达10万个token的输入上显示出改进。7B和13B代码Llama和代码Llama-指令变体支持基于周围内容的填充。Code Llama在几个代码基准测试中达到了开放模型中最先进的性能,在HumanEval和MBPP上的得分分别高达53%和55%。值得注意的是,Code Llama-Python 7B在HumanEval和MBPP上的性能优于Llama 2 70B,我们所有的模型在MultiPL-E上的性能都优于其他所有公开可用的模型。我们在允许研究和商业使用的许可证下发布Code Llama。
1 引言
2 Code Llama:专业化Llama2用于代码
3 结果
4 负责任的人工智能与安全
5 相关工作
6 讨论
我们发布了一系列代码专用的Llama 2模型,称为cod
本文介绍了Code Llama,一个基于Llama 2的大型代码语言模型系列,提供最先进的性能和编程任务解决方案。Code Llama包括基础模型、Python专业化模型以及指令跟随模型,适用于各种应用场景。在多个代码基准测试中表现出色,超越其他公开模型。
已下架不支持订阅
470

被折叠的 条评论
为什么被折叠?



