- 博客(279)
- 收藏
- 关注
原创 Agent Memory:智能体应用中被低估的超级能力
严格来说,记忆并非智能体的必需组件,但在几乎所有智能体应用中,长时记忆都是“零后悔”的升级选择。它不仅能让智能体记住用户偏好和历史交互,还能构建更连贯的对话体验,使AI从“一次性交互工具”进化为“持续学习的智能伙伴”。在智能体应用爆发的2025年,记忆能力将成为区分平庸与卓越智能体的关键超级能力。
2025-06-18 08:15:00
254
原创 如何使用LangGraph在AI应用中动态路由查询(结合RAG与LLMs)
通过LangGraph实现的动态路由机制,AI应用得以摆脱“一刀切”的处理模式,根据用户查询的语义、上下文和业务需求,动态选择最优处理路径。这种能力不仅提升了系统的响应效率和准确性,更赋予AI应用可扩展的“智慧中枢”——无论是结合RAG处理专业数据,还是通过LLM实现自然交互,LangGraph都为开发者提供了灵活且强大的编排工具。
2025-06-17 08:15:00
500
原创 AI Agent架构:基于A2A与MCP协议的技术整合与实践探索
AI Agent架构的核心竞争力在于标准化带来的规模化协作能力。通过A2A与MCP协议,不同厂商的AI模型、工具与资源得以在统一框架下协同工作,形成从数据输入、任务分解到执行落地的完整链条。未来,随着协议生态的成熟与技术融合的深入,AI Agent将逐步从辅助工具演变为数字世界的“通用劳动者”,在智能制造、智慧医疗、智能金融等领域实现复杂任务的全自动化处理,推动人工智能技术从实验室走向大规模工业化应用。
2025-06-16 08:15:00
1320
原创 基于知识图谱的Zero-Shot问答:大语言模型的事实锚定新范式
实现通用型知识增强LLMs仍需跨学科突破:神经符号系统的深度融合、开放域图谱的实时推理、多模态知识的联合表示等。未来的研究可能从生物脑的“陈述性记忆-程序性记忆”机制中获取灵感,构建更接近人类推理的知识调用模型。正如知识图谱之父Tim Berners-Lee所言:“链接数据的终极目标是让机器理解世界的本质”,而KAPING正是这一目标在大语言模型时代的重要实践。
2025-06-15 08:15:00
751
原创 突破延迟壁垒:AI智能体优化深度解析
在AI领域,速度已不再是单纯的技术指标,而是用户体验、商业价值甚至产品竞争力的核心构成要素。一个600毫秒响应的智能体与一个11秒响应的智能体之间,相差的不仅是10秒的时间,更是用户对产品“可用”与“不可用”的根本判断。从技术层面看,延迟优化需要融合模型压缩、并行架构、流式交互等多维度技术;从商业层面看,它要求企业将“速度”视为与“准确性”同等重要的产品特性,贯穿于需求分析、架构设计、迭代优化的全流程。
2025-06-14 08:15:00
526
原创 LLM评估:从原型开发到生产部署的全流程实践
正如文中案例所示,一个成熟的LLM评估框架并非一蹴而就,而是需要结合业务需求、技术选型和行业特性,通过不断迭代逐步完善。未来,随着评估工具的智能化(如自动生成测试用例、动态调整指标权重),LLM评估将成为AI工程化中愈发关键的基础设施,推动大语言模型从"实验室奇迹"走向"工业级解决方案"。
2025-06-13 08:15:00
651
原创 RAG:2025年检索增强生成前沿技术完全指南
从实验室走向企业级应用,RAG正在重新定义AI系统的构建范式。它通过“检索增强生成”的核心理念,既保留了大语言模型的创造性,又赋予其可追溯、可验证的可信属性。到2025年,随着七大前沿技术的成熟落地,RAG将不再局限于工具层面的优化,而是成为驱动各行业智能化转型的核心引擎。
2025-06-12 08:15:00
1889
原创 构建真正有效的AI代理的七个关键步骤:从理论到实践的完整指南
构建真正有效的AI代理,本质上是一场"去泡沫化"的技术实践。它要求我们跳出"炫技式开发"的陷阱,回归"解决真实问题"的初心。通过本文提出的七大步骤,企业与开发者能够建立一套可复制的方法论,让AI代理从"演示厅的花瓶"转变为"生产线的齿轮",最终在降本增效、创新商业模式等方面释放巨大价值。
2025-06-11 08:15:00
844
原创 上下文窗口错觉:为什么你的 128K token 不起作用
大语言模型的长上下文能力并非“即插即用”的魔法,而是需要精细调校的复杂系统。唯有将工程智慧与技术洞察结合,才能穿透“容量膨胀”的迷雾,让每一个Token都产生真正的商业价值。
2025-06-10 08:15:00
634
原创 如何在不陷入复杂性陷阱的情况下构建生产就绪的 AI 代理
正如Unix之父肯·汤普逊所言:“ simplicity is the ultimate sophistication”(简单是终极的复杂)。在智能体架构的设计中,这种“少即是多”的哲学,或许正是通往可落地AI的必经之路。当每个智能体都能在其专精领域成为“专家”,由它们组成的协同网络,终将比任何单一的“超级智能体”更加强大、可靠且富有生命力。
2025-06-09 08:15:00
1131
原创 一文读懂 Embeddings 与 RAG 架构:分词、向量数据库到生产级系统设计
嵌入与RAG技术的出现,标志着AI系统从“模式匹配”迈向“语义理解”的新纪元。无论是开发企业知识库问答系统,还是构建下一代搜索引擎,掌握从文本到向量、从检索到生成的完整链路,是实现智能系统的关键。通过本文所述的理论基础、技术选型与实践经验,读者可逐步搭建健壮、高效的RAG系统,并在不断迭代中适应AI领域的快速变革。
2025-06-08 08:15:00
865
原创 从数据抓取到智能分类:用 LangChain + 爬虫构建自动化工作流的实战笔记
本文通过作者的实际案例,展示了如何将网络爬虫和大语言模型相结合,解决现实中的繁琐任务自动化问题。这一实践不仅证明了技术在提高工作效率、减少人工劳动方面的巨大潜力,更揭示了构建实用AI解决方案的关键:明确需求、合理分工、选择合适的工具和技术,并在实践中不断迭代和优化。
2025-06-07 08:15:00
640
原创 结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践
本文提出的基于Qdrant miniCOIL、LangGraph和SambaNova DeepSeek-R1的混合RAG方案,通过融合稀疏检索的精准性与稠密检索的语义理解能力,为企业级智能问答提供了高效解决方案。miniCOIL的轻量化设计使其在保持语义增强的同时避免了传统神经检索的存储开销,而LangGraph的可视化流程编排降低了RAG系统的开发门槛。
2025-06-05 08:15:00
878
原创 构建生产级LLM应用完整指南:从原型到落地的全流程实践
本文将以实战为导向,结合代码示例与架构设计,详解如何将一个基于OpenAI API的简单聊天机器人,升级为具备容错能力、成本可控且可弹性扩展的生产级系统。无论你是AI开发者、技术负责人还是创业团队,都能从中获取从环境搭建到运维监控的全生命周期解决方案。
2025-06-04 08:15:00
837
原创 AI 时代下设计模式的逆袭:为何经典架构思想从未过时?
设计模式的本质是软件设计基本原则的具象化,包括封装、抽象、多态、单一职责原则、开闭原则等。GoF模式仅是这些原则在面向对象编程中的具体应用示例,而架构模式、领域模式则是原则在更高层次的延伸。在AI时代,这些原则的重要性并未减弱,反而因开发效率的提升而更加凸显。AI能快速生成代码,但缺乏对原则的理解,无法判断代码是否遵循“高内聚、低耦合”“对扩展开放、对修改关闭”等核心思想。人类开发者的职责,正是通过设计模式将这些原则注入到AI生成的代码中,确保系统具备长期演进的能力。
2025-06-03 08:15:00
634
原创 RAG中基于图的重排序:利用图神经网络革新信息检索(含代码)
基于图的重排序技术通过将检索问题转化为图结构中的关系推理,突破了传统模型“孤立评分”的局限,为信息检索带来了三大核心价值:全局语义建模能力、结构化知识注入能力、动态关联推理能力。
2025-06-02 08:15:00
746
原创 从执行轨迹到结果质量:AI 代理系统评估的核心要素与方法论
人工智能代理系统的评估是一个复杂的挑战,远远超出了传统的模型评估。它不仅需要理解最终输出,还需要理解系统的中间决策、工具使用和推理路径。通过采用基于代码的评估、以大型语言模型作为评判者的评估和人工标注等多种评估方法,结合对代理轨迹的分析,我们可以更全面、准确地评估人工智能代理系统的性能。
2025-06-01 08:15:00
818
原创 Agentic RAG 的技术演进详解
Agentic RAG的出现,不仅是技术的革新,更是人机关系的重新定义。它让机器从“按指令行事的工具”进化为“理解需求、自主决策、持续进化的伙伴”,人类得以从重复性知识工作中解放,专注于创造力、战略思维和情感连接等机器难以替代的领域。
2025-05-31 08:15:00
937
原创 基于Gemini与Qdrant构建生产级RAG管道:设计指南与代码实践
RAG技术的价值不仅在于解决LLM的固有缺陷,更在于构建可进化的智能系统——通过持续优化数据管道和提示策略,企业能够以更低成本适应业务需求的快速变化。随着Gemini等多模态模型的迭代,RAG将在更多垂直领域(如智能制造、智慧医疗)释放更大潜力。
2025-05-30 08:15:00
833
原创 AgentOps 时代已来:LLM-D 如何推动企业 AI 从理论走向规模化落地?
AgentOps时代不是即将到来,而是已经到来。现在的问题不再是自治系统是否会改变企业运营,而是谁将引领这一变革并获得巨大利益?对于企业来说,拥抱LLM-D不仅仅是采用一项新技术,更是在人工智能时代抢占战略高地的关键举措。随着分布式推理能力的成熟,代理式人工智能将渗透到企业的各个角落,重新定义运营模式、提升效率,并创造前所未有的价值。
2025-05-29 08:15:00
740
原创 数据提取场景下不同LLM模型对比分析
LLM模型为数据提取带来了革命性的机遇,但同时也带来了诸多挑战。通过深入的对比分析和持续的研究探索,我们能够更好地利用LLM技术,提升数据处理的效率和质量,为数字化时代的发展提供有力支持。
2025-05-28 08:15:00
702
原创 RAG(检索增强生成):提升大语言模型性能的终极指南
RAG的本质,是将检索(Retrieval)与生成(Generation)相结合,让LLMs在回答问题时不再依赖“记忆”,而是通过实时检索外部知识库获取最新信息。
2025-05-27 08:15:00
927
原创 基于 DSPy 与 Pydantic 的自然语言参数提取框架(含code)
参数提取作为自然语言理解(NLU)的基础任务,其本质是从非结构化文本中识别并抽取关键信息,形成符合特定业务逻辑的结构化数据。这一过程不仅是对话系统理解用户意图的“桥梁”,更是自动化系统执行任务的前提。
2025-05-26 08:15:00
2805
原创 LLM中的知识留存:解决LLM的灾难性遗忘问题
灾难性遗忘的本质,是AI在从“专项学习”向“终身学习”跃迁中遭遇的认知瓶颈。从记忆回放的“温故知新”,到PEFT的“模块化生长”,再到元学习的“学习如何学习”,人类正逐步为AI搭建认知脚手架,使其既能在专业领域深耕,又不丢失通用智慧的根基。
2025-05-25 08:15:00
607
原创 LLM的 “自信陷阱”:上下文幻觉如何侵蚀 AI 信任?
大语言模型的出现无疑是人工智能领域的一次重大飞跃,其在信息处理和语言生成方面的能力令人惊叹。然而,上下文幻觉的存在提醒我们,单纯追求“智能”是不够的,AI系统还必须具备“可信”的品质。
2025-05-24 08:15:00
511
原创 2025年GitHub上十大RAG框架深度解析:从技术原理到实战应用
RAG(Retrieval-Augmented Generation)技术通过动态检索外部知识来增强大型语言模型(LLMs)的生成能力,解决了传统LLMs知识截止和“幻觉”风险的问题。其核心流程包括检索、融合和生成,显著提升了生成内容的准确性和可解释性。RAG技术在金融、医疗、电商等领域展现出巨大实用价值,成为构建下一代智能应用的核心技术底座。2025年GitHub上十大RAG框架包括Haystack、RAGFlow、txtai、STORM、LLM-App、Cognita、R2R、Neurite、Flash
2025-05-22 08:15:00
522
原创 如何基于自定义MCP服务器构建支持工具调用的Llama智能体(含code)
本文探讨了如何构建一个完全本地化的AI智能体,以解决隐私保护和数据主权问题。通过自定义的ModelContextProtocol(MCP)服务器和Llama3.2轻量级模型,实现了知识隔离和工具调用能力。MCP服务器通过只读访问控制、路径隐私保护和协议深度理解,确保数据在本地运行,避免泄露风险。Llama3.2模型因其设备友好性、工具调用支持和性能平衡,成为本地化智能体的理想选择。智能体架构包括MCP客户端与管理器、LLM模型接口和智能体逻辑层,通过工具调用决策与结果处理,实现问答逻辑。实验表明,该方案在知
2025-05-21 08:15:00
1512
1
原创 理解LLM评估指标综述:可靠评估LLM的最佳实践
大语言模型(LLMs)作为强大工具,在众多领域崭露头角。从客户服务、市场营销,到研究和产品开发,大语言模型的应用日益广泛,它们能够简化流程、辅助决策并提升用户体验。然而,能力越大,责任越大。确保这些模型的可靠性、性能和适用性至关重要,而大语言模型评估指标在其中发挥着关键作用。
2025-05-20 08:15:00
899
原创 RAG架构综述:探寻最适配RAG方案
RAG技术通过整合外部知识源检索与模型生成能力,使语言模型能够基于真实世界的信息生成更准确、可靠的回答。如今,RAG技术不断演进,衍生出了多种各具特色的架构类型,每种都针对特定场景和需求进行了优化。
2025-05-19 08:15:00
768
原创 解析LangGraph中的状态、状态图和工作流
状态、状态图和工作流是LangGraph的核心概念。状态作为信息的载体,在工作流执行过程中不断传递和更新;状态图为工作流提供了结构化的设计蓝图,定义了节点、数据流向和状态更新方式;工作流则是状态图的实际运行实例,将状态在状态图规定的路径上推进,实现复杂的AI任务。
2025-05-18 08:15:00
2066
原创 利用大语言模型在Neo4j中构建用于图RAG应用的知识图谱
基于图的RAG与大语言模型的结合不仅仅是一种技术趋势,更是可解释的智能系统的未来发展方向。通过使用大语言模型智能体从原始文本构建知识图谱,并利用Neo4j的强大功能,我们能够从非结构化数据中获得更深入、结构化的见解。
2025-05-17 08:15:00
847
原创 探索LLM引用生成:方法与挑战
在大语言模型(LLM)蓬勃发展的当下,问答系统成为其最广泛的应用场景之一。然而,LLM “幻觉” 的倾向犹如高悬的达摩克利斯之剑,时刻警示着用户不能盲目轻信其回复。为了提升回复的可信度与可解释性,引用机制应运而生,成为增强LLM输出可靠性的关键手段。
2025-05-16 08:15:00
771
原创 突破LLM的token限制:多块上下文保留的实用系统(含code)
大语言模型(LLMs)取得了令人瞩目的进展,已广泛应用于文本生成、翻译、问答等诸多场景。然而,LLMs存在的一些局限性,如有限的上下文窗口(令牌限制)和缺乏长期记忆,限制了其在处理复杂任务时的表现。本文将深入探讨一种实用的解决方案,旨在克服这些限制,提升LLMs的性能。
2025-05-15 08:15:00
915
原创 深入剖析 GraphRAG 的工作原理:步步拆解
GraphRAG本质上是对检索增强生成技术的强化,它借助图结构来优化信息检索和生成过程。与传统RAG不同,GraphRAG能够更好地捕捉数据之间的关系,从而在处理复杂查询时表现出更高的效率和准确性。
2025-05-14 08:15:00
575
原创 探索RAG数据分块策略:工具对比与实践指南(含code)
本文探讨了检索增强生成(RAG)应用中的数据分块策略,重点介绍了LangChain、LlamaIndex和Preprocess三种主流工具的功能与特点。数据分块在RAG中至关重要,合理分块能提升检索效率和生成内容的相关性。LlamaIndex提供固定块大小、语义分块和主题节点解析等策略;LangChain则包括字符文本分割、递归字符文本分割和语义分块;Preprocess则擅长处理复杂文档,提供高质量分块。文章还分析了不同工具在PDF、PPT和Word文档处理中的表现,并建议根据数据类型、应用场景和资源限制
2025-05-13 08:15:00
1576
原创 揭开RAG评估的神秘面纱,让 RAG 评估不再困难(含代码)
检索增强生成(Retrieval-Augmented Generation,RAG)技术近年来备受瞩目。RAG系统结合了信息检索和语言生成的优势,通过从大量文本中检索相关信息来辅助生成高质量的文本内容,广泛应用于问答系统、文档生成等场景。然而,对RAG系统进行准确评估却面临诸多挑战,传统评估方法存在局限性,使得RAG评估犹如一个“黑箱”,难以清晰洞察系统内部的运行机制和性能表现。如何打破这个黑箱,成为当前RAG技术发展中的关键问题。
2025-05-11 08:15:00
923
原创 MicroAgents 框架,如何实现 LLM 工具调用自由?(含代码)
在LLM实际应用中,如何高效地协调多个语言模型智能体,并实现广泛的工具调用,成为了一个亟待解决的关键问题。MicroAgents框架应运而生,它以其轻量级、灵活性强的特性,为这一难题提供了创新的解决方案。
2025-05-10 08:15:00
1309
原创 RASA:LLM系统中实现智能体记忆的认知框架(含代码)
大语言模型(LLMs)和智能体不断进化,已不再局限于简单的响应和输出,而是在推理与行动能力上持续成熟。随着智能体架构的进步,记忆、回忆和知识应用的方式,在系统设计和可信度方面变得愈发关键且复杂。RASA(Role-Aligned Software Architecture,角色对齐软件架构)作为一个创新性的认知框架,为构建具备强大记忆能力、能够灵活适应各种场景的智能体提供了全新的思路和方法。
2025-05-09 08:15:00
960
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人