引言
多智能体的架构演进过程:
第一阶段:B商城工单自动回复,LLM和RAG结合知识库应答,无法解决工具调用。
第二阶段:京东招商站,单一Agent处理知识库问答和工具调用,准确率低 & LLM模型幻觉,场景区分度差。
第三阶段:京麦智能助手,引入multi-agent架构,master + subagents协同工作模式,把问题分而治之,显著提升准确率。
商家助手的算法底座是基于大语言模型(LLM)构建的Multi-agent系统,模拟的是现实中电商商家团队的经营协作方式。商家只需使用他们最熟悉的自然语言,与京麦平台上的这个助手进行沟通,就可以获得7*24小时的经营代理服务。本文档将从模拟的现实商家经营空间映射到Multi-agent算法空间,逐步解析电商平台业务场景下商家助手的业务动机、算法技术架构以及关键技术。
商家助手Multi-agent是一个通用&开放的商家经营服务多种能力(比如销量预测,营销投放,定价,商机词推荐等)接入的宿主,可随着建设的不同阶段友好的面向其他能力提供方的Tools,包括Agent、API等形式。
1.商家经营:从多角色现实空间到Multi-Agent算法空间
Multi-Agent系统架构的设计动机来自于“Agent模拟的是现实世界的人的解决问题过程”的本质。首先介绍现实世界商家和他的团队是怎么经营的,以及他们和AI世界怎么进行角色映射。
2、Multi-Agent Planning关键技术:
2.1 Agent构建技术:ReAct范式的多模型集成
1. Agent构建集成四类模型,实现了Agent大脑的智能化逆向规划能力:
•LLM:审题并提炼终极目标,为逆向规划定向,同时校验调用链路的合理性。
•Embedding:快速匹配终极节点工具,避免LLM冗长prompt和选择工具幻觉问题。
•Tools DAG:进行多路径逆向推理,结合LLM抽取参数工具,精确得到调度策略。
•运筹优化:理论上可加速解题,提升逆向规划效率,待实际测试验证。
2. ReAct规划动态更新
动态规划更新:在规划正向执行中,ReAct范式实现每一步根据执行结果的动态规划更新。
3.技术挑战和收益:
•提升规划效率,降低推理成本:多个模型编排替代超大模型,显著提高推理速度与规划效率,同时节约推理成本。
•提升架构稳定性,效果、风险可控:任务拆分后,小模型处理简单明确任务,大模型专注单一复杂任务,合理分工使效果与风险均可控,减少模型迭代对整体的影响。
•治理LLM幻觉提升规划质量:Embedding解决LLM带来的不确定性与幻觉,Tools DAG确保规划逻辑性与准确性,京麦场景工具调用准确率提升10%。
•减少LLM样本工程量:LLM仅处理文本理解,不直接选工具,避免新工具需大量样本训练的问题,系统扩展性与维护效率提高60%以上。
•实时性和准确性:通过ReAct动态规划更新,实时调整策略,优化执行链路。
2.2 Multi-Agent Online Inference
2.2.1 技术特色
1. 任务分层动态规划与分布式协作:基于ReAct范式,通过Master Agent和Sub Agents在不同层级进行任务动态规划和动态调度,支持分布式协作。
•Master Agent:在领域层面进行任务规划,将复杂场景拆解为多个独立子任务调度sub-Agens协同工作。
•Sub Agents:在领域内执行任务规划,负责具体的子任务执行,支持分布式调度和协同工作。
2. Agent协作基于标准通信协议:
通过标准通信协议确保Muti-agent高效协同工作,支持多步联动和全局思维链规划。
•Agent标准通讯协议:确保Muti-agent系统中的各agent高效协同工作,支持任务的分层规划和执行。
•多步联动:支持多个相互依赖的任务,通过ReAct单步执行和回调机制,完成复杂任务。