
📌 一句话总结:
本工作提出 RPG(Repository Planning Graph),一种统一功能规划与实现细节的图结构框架,并基于此构建 ZeroRepo 系统,让大语言模型能够从高层描述自动生成完整可运行的软件仓库,大幅提升代码规模、结构一致性与功能正确率。
🔍 背景问题
虽然大模型在函数级别代码生成上已经十分出色,但要让它从零开始构建一个完整的软件仓库,仍然是个难题。
主要挑战在于:
1️⃣ 当前方法依赖自然语言进行模块规划,容易出现歧义、遗漏和重复;
2️⃣ 缺乏统一的结构化表示,难以维持模块间依赖关系;
3️⃣ 规划结果无法在多轮生成中保持一致,导致仓库碎片化、代码失配。
💡 方法简介
作者提出的 Repository Planning Graph (RPG) 为这一问题提供了解法。
RPG 将整个代码仓库的功能目标、文件结构、数据流与函数实现统一在一个图结构中。节点代表功能模块、文件或函数,边表示模块之间的语义依赖与数据流关系。
基于这一结构化表示,论文构建了三阶段的 ZeroRepo 框架:
1️⃣ Proposal-Level Construction —— 将用户需求映射到大规模功能树(EpiCoder Feature Tree),自动选取相关功能模块;
2️⃣ Implementation-Level Construction —— 在图中编码文件夹、模块接口、类与函数,实现仓库骨架;
3️⃣ Graph-Guided Code Generation —— 按拓扑顺序遍历图结构,采用测试驱动开发(TDD)逐步实现与验证代码,最终生成完整、可运行的仓库。
同时,作者还构建了全新的评测基准 RepoCraft,包含六个真实工程(如 scikit-learn、pandas、django 等),共 1052 个任务,用于系统性评估仓库级代码生成的规模、正确率与创新性。
📊 实验结果
在 RepoCraft 上,ZeroRepo 的表现远超现有所有基线方法。
与 Claude Code、Gemini CLI、Codex CLI 等代表性系统相比,ZeroRepo 的功能覆盖率提升超过 27 个百分点,测试正确率提升 35 个百分点,同时生成的代码规模达到36K 行、45 万代码 token,是 Claude Code 的近四倍、其他方法的六十多倍。
更重要的是,RPG 使得代码仓库能够持续线性扩展:随着规划迭代的增加,功能模块与代码规模都能稳定增长,而自然语言规划方法往往在数轮后停滞。
此外,RPG 还让模型的定位与调试过程更高效,平均减少约一半的搜索与修复步骤,显著提升了系统开发的连贯性与速度。
💬 关键洞察
结构化思维代替自然语言规划:RPG 让大模型像工程师一样“画图思考”,以显式依赖和层次关系来驱动代码生成。
更像真实软件工程:ZeroRepo 的三阶段设计,模拟了人类从需求分析、架构设计到代码实现的完整开发链。
可扩展与可解释:RPG 为大模型提供了持久的、可拓展的开发语义空间,让 AI 能真正理解并操控大型工程。
📄 论文原文:
RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation
🔗 https://arxiv.org/abs/2509.16198
✨ 一句话回顾:
RPG 让大模型从“写代码”迈向“造工程”,为 AI 软件开发打开了新的认知维度。
那么,如何系统的去学习大模型LLM?
作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。


👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。

👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

被折叠的 条评论
为什么被折叠?



