1秒响应、90%决策准确率！京东商家智能助手的技术探索

京东零售技术

于 2025-02-14 18:10:38 发布

阅读量925

点赞数 35

文章标签：人工智能大模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/zheli1969917/article/details/145639410

版权

引言

多智能体的架构演进过程：

第一阶段：B商城工单自动回复，LLM和RAG结合知识库应答，无法解决工具调用。

第二阶段：京东招商站，单一Agent处理知识库问答和工具调用，准确率低 & LLM模型幻觉，场景区分度差。

第三阶段：京麦智能助手，引入multi-agent架构，master + subagents协同工作模式，把问题分而治之，显著提升准确率。

商家助手的算法底座是基于大语言模型（LLM）构建的Multi-agent系统，模拟的是现实中电商商家团队的经营协作方式。商家只需使用他们最熟悉的自然语言，与京麦平台上的这个助手进行沟通，就可以获得7*24小时的经营代理服务。本文档将从模拟的现实商家经营空间映射到Multi-agent算法空间，逐步解析电商平台业务场景下商家助手的业务动机、算法技术架构以及关键技术。

商家助手Multi-agent是一个通用&开放的商家经营服务多种能力（比如销量预测，营销投放，定价，商机词推荐等）接入的宿主，可随着建设的不同阶段友好的面向其他能力提供方的Tools，包括Agent、API等形式。

1.商家经营：从多角色现实空间到Multi-Agent算法空间

Multi-Agent系统架构的设计动机来自于“Agent模拟的是现实世界的人的解决问题过程”的本质。首先介绍现实世界商家和他的团队是怎么经营的，以及他们和AI世界怎么进行角色映射。

QCon_京东商家智能助手.mp4

2、Multi-Agent Planning关键技术：

2.1 Agent构建技术：ReAct范式的多模型集成

1. Agent构建集成四类模型，实现了Agent大脑的智能化逆向规划能力：

•LLM：审题并提炼终极目标，为逆向规划定向，同时校验调用链路的合理性。

•Embedding：快速匹配终极节点工具，避免LLM冗长prompt和选择工具幻觉问题。

•Tools DAG：进行多路径逆向推理，结合LLM抽取参数工具，精确得到调度策略。

•运筹优化：理论上可加速解题，提升逆向规划效率，待实际测试验证。

2. ReAct规划动态更新

动态规划更新：在规划正向执行中，ReAct范式实现每一步根据执行结果的动态规划更新。

3.技术挑战和收益：

•提升规划效率，降低推理成本：多个模型编排替代超大模型，显著提高推理速度与规划效率，同时节约推理成本。

•提升架构稳定性，效果、风险可控：任务拆分后，小模型处理简单明确任务，大模型专注单一复杂任务，合理分工使效果与风险均可控，减少模型迭代对整体的影响。

•治理LLM幻觉提升规划质量：Embedding解决LLM带来的不确定性与幻觉，Tools DAG确保规划逻辑性与准确性，京麦场景工具调用准确率提升10%。

•减少LLM样本工程量：LLM仅处理文本理解，不直接选工具，避免新工具需大量样本训练的问题，系统扩展性与维护效率提高60%以上。

•实时性和准确性：通过ReAct动态规划更新，实时调整策略，优化执行链路。

2.2 Multi-Agent Online Inference

2.2.1 技术特色

1. 任务分层动态规划与分布式协作：基于ReAct范式，通过Master Agent和Sub Agents在不同层级进行任务动态规划和动态调度，支持分布式协作。

•Master Agent：在领域层面进行任务规划，将复杂场景拆解为多个独立子任务调度sub-Agens协同工作。

•Sub Agents：在领域内执行任务规划，负责具体的子任务执行，支持分布式调度和协同工作。

2. Agent协作基于标准通信协议：

通过标准通信协议确保Muti-agent高效协同工作，支持多步联动和全局思维链规划。

•Agent标准通讯协议：确保Muti-agent系统中的各agent高效协同工作，支持任务的分层规划和执行。

•多步联动：支持多个相互依赖的任务，通过ReAct单步执行和回调机制，完成复杂任务。

2.2.2 Multi-Agent Online Inference 演示&#

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。