文章介绍了如何使用Cleanlab Codex改进RAG系统回答准确性的技术方案。详细阐述了Agentic RAG工作流的架构设计,包括使用LlamaIndex进行编排、Milvus作为向量数据库、Cleanlab Codex验证回答等技术栈。文章提供了完整的代码实现步骤,从设置LLM、SQL查询引擎到创建Agentic工作流和Streamlit用户界面,并展示了如何通过信任分数评估回答质量。最后提供了GitHub代码地址,适合程序员学习和实践。
RAG 系统生成不准确/无用回答是很常见的。

今天,我们来看看如何使用 Cleanlab Codex 来改进这一点。Cleanlab Codex 通常用于生产系统中,可以自动检测并解决 RAG 的不准确问题。

下文我们详细剖析之。
1、Agentic RAG 工作流架构设计
第一、Agentic RAG 工作流使用的技术栈
- 使用 LlamaIndex 进行编排;
- 使用 Milvus 作为自托管的向量数据库;
- 使用 Cleanlab Codex 验证回答;
- 使用 OpenRouterAI 访问最新的 Qwen3 C。
第二、Agentic RAG 工作流架构设计

- LLM 处理查询以选择工具;
- 将查询转换为正确的格式(文本/SQL);
- 执行工具并获取输出;
- 生成带有丰富上下文的回答;
- 使用 Cleanlab 的 Codex 验证回答
2、Agentic RAG 工作流代码实现
第一、设置 LLM
我们将使用通过 OpenRouter 提供的最新 Qwen3。确保 LLM 支持工具调用,以便无缝执行。

第二、设置 SQL 查询引擎
自然语言到 SQL 引擎可以将普通查询转换为 SQL 命令,从而实现轻松的数据交互。

第三、设置 RAG 查询引擎
使用 Docling 将 PDF、DOCX 或任何文档转换为 Markdown 格式,以便进行向量存储。查询引擎从 Milvus 中获取上下文,将其与查询结合,然后发送给 LLM 以获取回答。

第四、设置工具
现在,是时候设置并使用我们上面定义的两个查询引擎作为工具了。我们的 AI 智能体将智能地将查询路由到正确的工具。

第五、Cleanlab Codex 验证
接下来,我们通过几行代码将 Cleanlab Codex 集成进来,以评估和监控 RAG 应用。

第六、创建 Agentic 工作流
一切准备就绪后,让我们创建我们的 Agentic 路由工作流。

第七、启动工作流
一切准备妥当,是时候激活我们的工作流了。我们首先为 LLM 配备两个工具:文档和文本到 SQL 查询。之后,我们启动工作流。

第八、Streamlit 用户界面
为了提升用户体验,我们将所有内容都展示在一个简洁且交互式的 Streamlit 用户界面中。

在提示词后,注意应用会在生成的回答上显示一个信任分数。这对于容易出现不准确和幻觉的 RAG/AI 智能体工作流来说非常重要。

除此之外,我们还能获得每次测试运行的具体评估指标,以及详细的见解和推理:

完整代码 GitHub 获取地址:
→ https://github.com/patchy631/ai-engineering-hub/tree/main/rag-sql-router
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套 AI 大模型突围资料包:
- ✅ 从零到一的 AI 学习路径图
- ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
- ✅ 百度/阿里专家闭门录播课
- ✅ 大模型当下最新行业报告
- ✅ 真实大厂面试真题
- ✅ 2025 最新岗位需求图谱
所有资料 ⚡️ ,朋友们如果有需要 《AI大模型入门+进阶学习资源包》,下方扫码获取~

① 全套AI大模型应用开发视频教程
(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线
作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档
学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题
面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

以上资料如何领取?

为什么大家都在学大模型?
最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。
风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!


这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


以上全套大模型资料如何领取?

1563

被折叠的 条评论
为什么被折叠?



