部署了满血版DeepSeek R1,总是答非所问!
别人手里的DeepSeek,是不是和我手里的不一样?
除非领导硬性要求,不然真的不想用它,徒增负担!!
……
部署前是小甜甜,部署后就变成了牛夫人?这是由于大模型还没有经过开发变成你需要的样子。
想让大模型用起来更顺手,有3大开发方向,分别是:微调、RAG、Agent。
作为今年最火的Agent,该从哪开始了解?工作中的卡点能用低代码平台解决吗?LangChain、AutoGen、LangGraph该怎么选?
今天要给大家介绍的,就是能让部署后的大模型接入不同工具,做到之前做不到的事情的开发框架。
本次会为大家介绍主流的、能实际在工作中使用的开发框架,分别是LangChain、LangGraph、AutoGen和Dify。
为了方便大家理解开发原理,本次会从LangChain开始讲起,熟悉了他,剩下的也就不难了。
最后也为大家准备了一份对比表格,帮助大家快速选择自己适合的开发框架。
同时大模技术社区也有完整的Agent开发教学,企业级实战项目,方便0基础的小伙伴也能迅速入门。长摁识别下方二维码,即可无偿领取所有资料。
0基础入门LangChain
解决了什么问题?
我们以ChatGPT为例,即使是大模型的领军人物、大模型天花板,但在使用时仍然会遇到各种各样的问题。
总结下来就是知识更新的滞后性、外部API调用能力、私有数据连接方式以及输出结果的不稳定性等问题
想要让GPT完整适配自己的需求,当然可以重新训练。但即使有了DeepSeek的技术出现,训练成本也要千万起步。
为了提供一个统一的平台和明确的定义,并能快速实现应用间的连接,LangChain就应运而生了。
简单的说,LangChain就像它的名字一样,像一根绳索一样把大模型与其他工具串联起来,让其他工具能弥补大模型能力的缺失。
而根据需要提供的链接方式,这里出相处6个模块:
-
Model I/O :标准化各个大模型的输入和输出,包含输入模板,模型本身和格式化输出;
-
Retrieval :检索外部数据,然后在执行生成步骤时将其传递到 LLM,包括文档加载、切割、Embedding等;
-
Chains :链条,LangChain框架中最重要的模块,链接多个模块协同构建应用,是实际运作很多功能的高级抽象;
-
Memory : 记忆模块,以各种方式构建历史信息,维护有关实体及其关系的信息;
-
Agents : 目前最热门的Agents开发实践,未来能够真正实现通用人工智能的落地方案;
-
Callbacks :回调系统,允许连接到 LLM 应用程序的各个阶段。用于日志记录、监控、流传输和其他任务;
借助这些功能,就可以像搭积木一样,把模型和各个不同的工具串联起来。
LangGraph是什么?
有些人说LangGraph是LangChain的升级版,毕竟是同一个公司出的,从功能和命名上看好像是这样,但两者适配的场景不同,使用起来也各有优劣。
具体区别如图:
就像前面说的,LangChain像一条锁链把各个功能串联起来,再根据锁链上的排序依次实现相关功能,而且触发后相关功能就一定会挨个运作一遍。
比如你让AI写小说,传统工具(如LangChain)像写流水账,只能按「开头→发展→结局」一条路走。
但现实中好故事需要反复修改:写一半发现人物矛盾,得倒回去改设定,甚至推翻重写。
为了解决这个问题,LangGraph出现啦~具体优势有:
循环思考:遇到分支剧情时,根据上下文同时生成多个方案,再选最优解
实时协调:当情况变化时,让不同AI介入
接力处理:第一个AI解决不了的问题,自动转给更专业的AI
什么是AutoGen?
AutoGen是微软提出的AI Agent开发框架,也是当下主流开发框架之一。
AutoGen 框架的第一大特色是支持创建对话式应用。
也就是说它构建多代理的方式是使多个智能体能够相互交流,从而促进不同智能体之间的合作以完成最终的任务。
简单的理解就是这个框架可以让不同的Agent建立起通信的连接,然后它提供给开发者的使用方式是,
其一可以为每个Agent自定义大模型、角色、工具及行为。
其二可以创建不同的对话模式,包括一问一答、联合聊天、分层聊天等等,从而实现高度个性化的应用场景设计。如下图所示:
而AutoGen第二大特色,则是与LangChain、LangGraph,rag、函数调用(Function Call)等功能集成在了一起。
额外补充:大模型本身不具备与外界工具调用和沟通的能力,而只有支持Function Call才能完成相关功能。
这就让我们可以非常方便的,通过额外的知识源去增强基于大模型的代理能力,从而使基于AutoGen构建的智能体能解决相对复杂的问题,和更多元化的应用场景。
Coze和Dify是什么?
在理解了LangChain之后,Coze和Dify就相对好理解了。
最大的区别就是在使用时,Coze和Dify把各个功能、模型打包压缩。
就像我们在windows电脑上安装程序一样,通过鼠标简单点击就可以完成自己的需要,而不再需要搭建环境,打开变成软件等等。
但方便也就代表着只能完成简单的任务,数据量也不能很大,所以一般是产品经理实现原型图使用。
以上便是主流Agent开发框架的汇总,快速确定自己需要选择哪一个,可以看下图:
文章出自【公益】赋范大模型技术社区!
为了避免0基础的小伙伴被「信息差」割韭菜,公益大模型技术社区汇聚了大量干货内容,对标别家千元级课程~
为的就是帮助0基础的小伙伴也能用上大模型并借助大模型提效!如果觉得有用,欢迎点赞、关注,点个在看哦~
【公益】大模型技术社区学习者已超万人!
还有完整的「从0到1微调大模型」(涵盖QWQ、DeepSeek等主流大模型)、「构建企业级私有知识库问答」实战教学,扫描下方二维码,即可免费加入!