大模型实践之知识库RAG以及Agent_kakaZhui的博客-优快云博客

大模型实践之知识库RAG以及Agent

文章平均质量分 92

以实战代码为线索，基于GPT、Deepseek、Qwen等模型，逐步讲解RAG、Agent的流程，并针对常见问题寻找优化方案。

文章数：19 文章阅读量：9151 文章收藏量：100

作者: kakaZhui

人工智能算法工程师，热爱AI，改变世界

展开

拨开迷雾：LLM Agent 的 MCP 究竟是什么？【之二(完)】

-------------------------------------书接上文----------------------

原创 2025-04-03 10:13:10 · 5 阅读 · 0 评论
拨开迷雾：LLM Agent 的 MCP 究竟是什么？【之一】

今年以来，Agent基于 LLM 构建能够自主规划、执行任务一直是人工智能领域最激动人心的前沿方向之一。在探索和构建 LLM Agent 的过程中，你可能经常听到一个缩写——MCP。“这个 Agent 用了 MCP 架构”、“MCP 有助于提高 Agent 的鲁棒性”…… 那么，这个被频繁提及的 MCP 到底是什么？它为什么对构建强大的 LLM Agent 如此重要？

原创 2025-04-03 10:09:19 · 427 阅读 · 0 评论
RAG 优化：高效解析并接入图文、表格密集型文档

检索增强生成 (Retrieval-Augmented Generation, RAG) 已成为构建智能问答、文档摘要、内容创作等应用的利器。然而，标准的 RAG 流程往往假设输入是纯文本。当我们面对现实世界中更常见的文档——那些充斥着大量图片、图表和表格的报告、手册、论文或网页时，传统的 RAG 方法就会显得力不从心。这些非文本元素往往蕴含着关键信息，忽略它们将导致 RAG 系统理解片面、回答不准确。你想问一个产品手册中某个零件的安装步骤，而关键信息在一张流程图里。

原创 2025-03-31 21:18:46 · 212 阅读 · 0 评论
基于 DeepSeek API，为你写一个专属的旅游攻略 Agent

本文将带你一步步深入，探讨如何利用强大的 DeepSeek API，设计并实现一个专属的 AI 旅游攻略 Agent。

原创 2025-03-28 22:35:29 · 145 阅读 · 0 评论
【实践】Manus如何从0到1复现

Manus在Level 1、Level 2、Level 3三个难度级别上均取得了SOTA结果，特别是在复杂任务（Level 3）上的表现优于其他AI助手。在GAIA基准测试中，Manus的复杂任务完成率高达78%，平均调用5.3个专业工具，综合表现超越OpenAI同类产品。用户请求 → 规划代理拆解 → 文件读取 → 数据提取 → 薪资验证 → 报告生成 → 结果验证 → 最终输出。“请分析resumes.zip中的3份简历，按技术匹配度排序并生成包含薪资建议的PDF报告”

原创 2025-03-12 17:00:37 · 197 阅读 · 0 评论
【RAG升级】RAG+联网搜索行不行？

将联网搜索整合进 RAG 并非简单地将两者叠加，需要深思熟虑的策略来确保效率、准确性和相关性。因此，需要一个“决策者”来判断何时触发联网搜索。将联网搜索整合到 RAG 系统中，是克服传统 RAG 静态知识限制、拥抱实时动态世界的关键一步。通过结合联网搜索，RAG 系统可以从“封闭世界的专家”转变为“连接世界的博学顾问”。现在我们可能同时拥有来自内部知识库和联网搜索的结果。最后，将融合排序后的信息有效地提供给 LLM 进行答案生成。触发联网搜索并生成查询后，下一步是实际执行搜索并处理结果。

原创 2025-03-26 18:14:57 · 265 阅读 · 0 评论
GraphRAG 融合 RAG：双剑合璧，精度更上一层楼

检索增强生成 (Retrieval-Augmented Generation, RAG) 已成为构建知识密集型 NLP 应用的标准范式。RAG 通过结合大型语言模型 (LLM) 的生成能力和外部知识库的检索能力，显著提升了生成结果的质量。然而，在某些场景下，仅依靠传统的 RAG 或 GraphRAG 可能无法达到最佳效果。本文将探讨一种融合 GraphRAG 和普通 RAG 的策略，通过优势互补，进一步提升 RAG 系统的精度。

原创 2025-03-13 22:14:45 · 247 阅读 · 0 评论
GraphRAG：知识图谱+RAG

GraphRAG 是一种将知识图谱与 RAG 相结合的技术。它利用知识图谱中的实体和关系来增强检索过程，并为 LLM 提供更丰富的上下文信息，从而提高生成答案的质量。与传统 RAG 的对比：传统 RAG知识库：扁平的文档集合（例如文本文件、网页）。检索：基于关键词或语义相似度进行文档检索。缺点：忽略了知识之间的结构化关系，难以处理需要推理的复杂查询。GraphRAG知识库：知识图谱（包含实体、关系、属性）。检索：基于知识图谱的结构和语义信息进行实体和关系检索。优点。

原创 2025-03-12 21:50:15 · 131 阅读 · 0 评论
【RAG实战优化】增加BGE-Reranker 如何提升检索精度

BGE-Reranker (BAAI General Embedding - Reranker) 提升RAG系统精度

原创 2025-03-03 20:28:35 · 436 阅读 · 0 评论
【RAG 优化实战】query改写提升复杂语义的搜索精度

还在为 RAG 系统无法理解复杂的用户问题而苦恼吗？本文揭秘了查询改写这一关键技术，文章深入浅出地介绍了各种查询改写策略，并配有代码示例，助您轻松驾驭多语义复杂查询！

原创 2025-02-27 20:19:33 · 349 阅读 · 0 评论
【实战总结】RAG常见应用场景、卡点与优化方案

满满干货，常见的几个RAG商业应用场景：知识库bot、结构化数据查询、多模态问答、搜索增强，各场景存在的卡点与解决方案分析

原创 2025-02-18 18:45:00 · 623 阅读 · 0 评论
大模型RAG优化之高可用向量数据库的“热更”难题与解决方案

想象一下，你正在运营一个大型电商平台，用户可以上传图片搜索相似商品。需要将新商品的特征向量添加到数据库。需要从数据库中删除旧商品的特征向量。商品的描述、图片等信息可能发生变化，需要更新对应的特征向量。如果每次更新都需要停止搜索服务、重建索引，那用户体验将大打折扣。因此，“热更”指的是在不中断或最小化中断搜索服务的情况下，实时更新向量数据库的索引，使其反映最新的数据变化。

原创 2025-02-07 23:05:22 · 307 阅读 · 0 评论
【llm对话系统】大模型 RAG 之回答生成：融合检索信息，生成精准答案

回答生成是 RAG 流程中的关键步骤，它将用户问题和检索到的文档片段融合起来，生成最终的答案。我们需要精心设计 Prompt，引导 LLM 更好地理解问题和文档片段，并采取措施控制幻觉问题，从而生成准确、流畅、相关且有根据的答案。

原创 2025-01-28 15:11:48 · 1518 阅读 · 0 评论
【llm对话系统】大模型RAG之文档处理方法

大模型RAG入门和进阶，配合各种生产遇到的问题分析

原创 2025-01-26 00:00:00 · 1069 阅读 · 0 评论
【llm对话系统】大模型 RAG 之向量化与索引构建

大模型 RAG 之向量化与索引构建：搭建知识库的桥梁

原创 2025-01-26 13:05:18 · 788 阅读 · 0 评论
【llm对话系统】大模型RAG之基本逻辑

大模型RAG入门与进阶，快速上手

原创 2025-01-25 13:45:00 · 865 阅读 · 0 评论
【llm对话系统】大模型RAG之向量数据库

Milvus 是一款**开源的、云原生的向量数据库**，专为**大规模向量相似性搜索**而设计。它能够存储、索引和查询海量的向量数据，并以毫秒级的速度返回最相似的结果。

原创 2025-01-23 22:30:00 · 765 阅读 · 0 评论
大模型 RAG 优化之预生成qa对

检索增强生成 (Retrieval-Augmented Generation, RAG) 是一种将检索 (Retrieval) 和生成 (Generation) 相结合的技术，它利用检索到的相关信息来增强大型语言模型 (LLM) 的生成能力。传统的 RAG 系统通常直接使用用户输入的 query 在文档库中进行检索 (query-doc 检索)，然后将检索到的文档作为上下文提供给 LLM 进行生成。用户 query 表达能力有限：用户输入的 query 可能不够准确或完整，无法有效地表达其信息需求。

原创 2025-02-06 21:00:00 · 213 阅读 · 0 评论
大模型RAG优化方案_融合bm25和语义检索

引入BM25提升RAG准确率

原创 2025-02-05 21:30:00 · 591 阅读 · 0 评论

大模型实践之知识库RAG以及Agent

作者: kakaZhui

拨开迷雾：LLM Agent 的 MCP 究竟是什么？【之二(完)】

拨开迷雾：LLM Agent 的 MCP 究竟是什么？【之一】

RAG 优化：高效解析并接入图文、表格密集型文档

基于 DeepSeek API，为你写一个专属的旅游攻略 Agent

【实践】Manus如何从0到1复现

【RAG升级】RAG+联网搜索行不行？

GraphRAG 融合 RAG：双剑合璧，精度更上一层楼

GraphRAG：知识图谱+RAG

【RAG实战优化】增加BGE-Reranker 如何提升检索精度

【RAG 优化实战】query改写提升复杂语义的搜索精度

【实战总结】RAG常见应用场景、卡点与优化方案

大模型RAG优化之高可用向量数据库的“热更”难题与解决方案

【llm对话系统】大模型 RAG 之回答生成：融合检索信息，生成精准答案

【llm对话系统】大模型RAG之文档处理方法

【llm对话系统】大模型 RAG 之向量化与索引构建

【llm对话系统】大模型RAG之基本逻辑

【llm对话系统】大模型RAG之向量数据库

大模型 RAG 优化之预生成qa对

大模型RAG优化方案_融合bm25和语义检索