Agentic RAG实战：LangChain+LangGraph+Docling+ChromaDB

在解决复杂问题时，传统的语言模型往往面临无法提供准确答案的挑战，尤其是当问题需要跨领域知识和多步骤推理时。

为了解决这个问题，有人用：LangChain + LangGraph + Docling + ChromaDB 构建了 RAG Research Multi-Agent 工具。并与 ChatGPT 对同一 PDF 进行测评的对比，展示了本系统在处理复杂查询时的优势，尤其是在确保答案可靠性和减少幻觉问题上的表现，远超传统语言模型。适用于企业级应用，助力高效问题解决。

该 RAG 工具项目采用以下几个关键步骤：

分析与路由查询（Adaptive RAG）：当用户提出查询时，系统首先进行分析，判断查询的复杂性并将其路由到合适的节点。对于复杂的查询，系统会生成详细的研究计划，并请求用户提供更多信息；若查询过于简单，则直接给出答案。
研究计划生成：系统为每个复杂查询生成一个分步执行的研究计划，明确每一步的具体任务。
研究子图（Subgraph）：每个研究步骤通过子图调用进行处理，生成查询并使用LLM进行推理。系统接着通过多种检索技术（如相似性搜索、BM25和MMR）检索相关文档，并通过Cohere的重排序机制进一步筛选最相关的文档。
生成步骤：系统基于检索到的文档生成答案，提供给用户。
幻觉检查（Hallucination Check）：系统对生成的答案进行检查，确保其与上下文一致。如果检查失败，系统会触发自我修正机制，通过重新生成答案来提升其可靠性。

项目实测：

结果正确，幻觉检查成功通过。

为了验证本系统的效果，我们将 ChatGPT 应用于同一 PDF 文件的查询任务。上传文件并提出相同的查询后，ChatGPT 返回的结果显示出明显的错误，并展现了幻觉（hallucinations）问题。

如图所示，ChatGPT 返回的答案明显不准确，且无法提供可靠的信息。在这种情况下，该 RAG 工具通过内置的幻觉检查机制，能够识别并修正这些错误，确保生成的答案更加可靠。系统通过自我修正（Self-Reflective RAG）流程，自动分析并重生问题答案，避免了传统语言模型可能出现的偏差。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述