论文阅读——《OpenAI Codex》
📄 论文信息
- 标题: Evaluating Large Language Models Trained on Code
- 作者: Mark Chen, Jerry Tworek, Heewoo Jun, et al.
- 机构: OpenAI
- 发表时间: 2021
- 原文链接: https://arxiv.org/abs/2107.03374
1. 论文背景
近年来,大型语言模型(LLMs)在自然语言处理(NLP)领域取得了巨大进展,而 OpenAI Codex 进一步扩展了其能力,使其能够理解和生成代码。Codex 是 GPT-3 的衍生模型,专门针对代码任务进行了训练,具备以下特点:
- 可以将自然语言转换为代码。
- 支持多种编程语言,包括 Python、JavaScript、Go、Ruby、Swift 等。
- 为 GitHub Copilot 提供了核心支持。
2. 论文核心方法
OpenAI Codex 主要基于 GPT-3 进行训练,并在海量代码数据(如 GitHub 代码库)上进行了微调。其核心能力体现在两个方面:

最低0.47元/天 解锁文章
3023






