kakaZhui
人工智能算法工程师,热爱AI,改变世界
展开
-
拨开迷雾:LLM Agent 的 MCP 究竟是什么?【之二(完)】
-------------------------------------书接上文----------------------原创 2025-04-03 10:13:10 · 5 阅读 · 0 评论 -
拨开迷雾:LLM Agent 的 MCP 究竟是什么?【之一】
今年以来,Agent基于 LLM 构建能够自主规划、执行任务一直是人工智能领域最激动人心的前沿方向之一。在探索和构建 LLM Agent 的过程中,你可能经常听到一个缩写——MCP。“这个 Agent 用了 MCP 架构”、“MCP 有助于提高 Agent 的鲁棒性”…… 那么,这个被频繁提及的 MCP 到底是什么?它为什么对构建强大的 LLM Agent 如此重要?原创 2025-04-03 10:09:19 · 427 阅读 · 0 评论 -
RAG 优化:高效解析并接入图文、表格密集型文档
检索增强生成 (Retrieval-Augmented Generation, RAG) 已成为构建智能问答、文档摘要、内容创作等应用的利器。然而,标准的 RAG 流程往往假设输入是纯文本。当我们面对现实世界中更常见的文档——那些充斥着大量图片、图表和表格的报告、手册、论文或网页时,传统的 RAG 方法就会显得力不从心。这些非文本元素往往蕴含着关键信息,忽略它们将导致 RAG 系统理解片面、回答不准确。你想问一个产品手册中某个零件的安装步骤,而关键信息在一张流程图里。原创 2025-03-31 21:18:46 · 212 阅读 · 0 评论 -
基于 DeepSeek API,为你写一个专属的旅游攻略 Agent
本文将带你一步步深入,探讨如何利用强大的 DeepSeek API,设计并实现一个专属的 AI 旅游攻略 Agent。原创 2025-03-28 22:35:29 · 145 阅读 · 0 评论 -
【实践】Manus如何从0到1复现
Manus在Level 1、Level 2、Level 3三个难度级别上均取得了SOTA结果,特别是在复杂任务(Level 3)上的表现优于其他AI助手。在GAIA基准测试中,Manus的复杂任务完成率高达78%,平均调用5.3个专业工具,综合表现超越OpenAI同类产品。用户请求 → 规划代理拆解 → 文件读取 → 数据提取 → 薪资验证 → 报告生成 → 结果验证 → 最终输出。“请分析resumes.zip中的3份简历,按技术匹配度排序并生成包含薪资建议的PDF报告”原创 2025-03-12 17:00:37 · 197 阅读 · 0 评论 -
【RAG升级】RAG+联网搜索行不行?
将联网搜索整合进 RAG 并非简单地将两者叠加,需要深思熟虑的策略来确保效率、准确性和相关性。因此,需要一个“决策者”来判断何时触发联网搜索。将联网搜索整合到 RAG 系统中,是克服传统 RAG 静态知识限制、拥抱实时动态世界的关键一步。通过结合联网搜索,RAG 系统可以从“封闭世界的专家”转变为“连接世界的博学顾问”。现在我们可能同时拥有来自内部知识库和联网搜索的结果。最后,将融合排序后的信息有效地提供给 LLM 进行答案生成。触发联网搜索并生成查询后,下一步是实际执行搜索并处理结果。原创 2025-03-26 18:14:57 · 265 阅读 · 0 评论 -
GraphRAG 融合 RAG:双剑合璧,精度更上一层楼
检索增强生成 (Retrieval-Augmented Generation, RAG) 已成为构建知识密集型 NLP 应用的标准范式。RAG 通过结合大型语言模型 (LLM) 的生成能力和外部知识库的检索能力,显著提升了生成结果的质量。然而,在某些场景下,仅依靠传统的 RAG 或 GraphRAG 可能无法达到最佳效果。本文将探讨一种融合 GraphRAG 和普通 RAG 的策略,通过优势互补,进一步提升 RAG 系统的精度。原创 2025-03-13 22:14:45 · 247 阅读 · 0 评论 -
GraphRAG:知识图谱+RAG
GraphRAG 是一种将知识图谱与 RAG 相结合的技术。它利用知识图谱中的实体和关系来增强检索过程,并为 LLM 提供更丰富的上下文信息,从而提高生成答案的质量。与传统 RAG 的对比:传统 RAG知识库:扁平的文档集合(例如文本文件、网页)。检索:基于关键词或语义相似度进行文档检索。缺点:忽略了知识之间的结构化关系,难以处理需要推理的复杂查询。GraphRAG知识库:知识图谱(包含实体、关系、属性)。检索:基于知识图谱的结构和语义信息进行实体和关系检索。优点。原创 2025-03-12 21:50:15 · 131 阅读 · 0 评论 -
【RAG实战优化】增加BGE-Reranker 如何提升检索精度
BGE-Reranker (BAAI General Embedding - Reranker) 提升RAG系统精度原创 2025-03-03 20:28:35 · 436 阅读 · 0 评论 -
【RAG 优化实战】query改写提升复杂语义的搜索精度
还在为 RAG 系统无法理解复杂的用户问题而苦恼吗?本文揭秘了查询改写这一关键技术,文章深入浅出地介绍了各种查询改写策略,并配有代码示例,助您轻松驾驭多语义复杂查询!原创 2025-02-27 20:19:33 · 349 阅读 · 0 评论 -
【实战总结】RAG常见应用场景、卡点与优化方案
满满干货,常见的几个RAG商业应用场景:知识库bot、结构化数据查询、多模态问答、搜索增强,各场景存在的卡点与解决方案分析原创 2025-02-18 18:45:00 · 623 阅读 · 0 评论 -
大模型RAG优化之高可用向量数据库的“热更”难题与解决方案
想象一下,你正在运营一个大型电商平台,用户可以上传图片搜索相似商品。需要将新商品的特征向量添加到数据库。需要从数据库中删除旧商品的特征向量。商品的描述、图片等信息可能发生变化,需要更新对应的特征向量。如果每次更新都需要停止搜索服务、重建索引,那用户体验将大打折扣。因此,“热更”指的是在不中断或最小化中断搜索服务的情况下,实时更新向量数据库的索引,使其反映最新的数据变化。原创 2025-02-07 23:05:22 · 307 阅读 · 0 评论 -
【llm对话系统】大模型 RAG 之回答生成:融合检索信息,生成精准答案
回答生成是 RAG 流程中的关键步骤,它将用户问题和检索到的文档片段融合起来,生成最终的答案。我们需要精心设计 Prompt,引导 LLM 更好地理解问题和文档片段,并采取措施控制幻觉问题,从而生成准确、流畅、相关且有根据的答案。原创 2025-01-28 15:11:48 · 1518 阅读 · 0 评论 -
【llm对话系统】大模型RAG之文档处理方法
大模型RAG入门和进阶,配合各种生产遇到的问题分析原创 2025-01-26 00:00:00 · 1069 阅读 · 0 评论 -
【llm对话系统】大模型 RAG 之向量化与索引构建
大模型 RAG 之向量化与索引构建:搭建知识库的桥梁原创 2025-01-26 13:05:18 · 788 阅读 · 0 评论 -
【llm对话系统】大模型RAG之基本逻辑
大模型RAG入门与进阶,快速上手原创 2025-01-25 13:45:00 · 865 阅读 · 0 评论 -
【llm对话系统】大模型RAG之向量数据库
Milvus 是一款**开源的、云原生的向量数据库**,专为**大规模向量相似性搜索**而设计。它能够存储、索引和查询海量的向量数据,并以毫秒级的速度返回最相似的结果。原创 2025-01-23 22:30:00 · 765 阅读 · 0 评论 -
大模型 RAG 优化之预生成qa对
检索增强生成 (Retrieval-Augmented Generation, RAG) 是一种将检索 (Retrieval) 和生成 (Generation) 相结合的技术,它利用检索到的相关信息来增强大型语言模型 (LLM) 的生成能力。传统的 RAG 系统通常直接使用用户输入的 query 在文档库中进行检索 (query-doc 检索),然后将检索到的文档作为上下文提供给 LLM 进行生成。用户 query 表达能力有限:用户输入的 query 可能不够准确或完整,无法有效地表达其信息需求。原创 2025-02-06 21:00:00 · 213 阅读 · 0 评论 -
大模型RAG优化方案_融合bm25和语义检索
引入BM25提升RAG准确率原创 2025-02-05 21:30:00 · 591 阅读 · 0 评论