大模型探索：Datawhale llm-universe Task1 简介

xuezhangdaima

于 2024-06-09 11:36:04 发布

阅读量101

点赞数

CC 4.0 BY-SA版权

文章标签： java

原文链接：https://www.keshedaima.cn

intro to LLM

大模型发展路线图

做了个导图简单汇总开源和闭源大模型

intro to langchain

langchain 架构图

找到了一张很好的图，清晰地说明了langchain的六个核心模块分别是干啥的，以及相互怎么交互

相关的链接
Modules | 🦜️🔗 Langchain

下面我依据图来做一个langchain架构的解析

6 个核心模块组成:

（Model I/O）
：以prompt来处理LLM的输入(模板template等)和输出(调整格式)
（Data connection）
：从网络or向量数据库中检索文本并分割成小块(LLM处理长度有限)
（Chains）
：Let LLM process step by step. 如此可以形成流水线，加快效率
（Memory）
：主要用于维护LLM的短期记忆(其实就是上下文状态)
（Agents）
：最早应该是起源于论文ReAct，让LLM在文字推理中学会调用一下外部api (感兴趣的可以看之后的文章，toolformer和graph-toolformer等)
（Callbacks）
：跟踪大模型的状态等，例如其参数verbose就是对应一个回调函数

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。