intro to LLM
- 大模型发展路线图
- 做了个导图简单汇总 开源和闭源大模型
intro to langchain
langchain 架构图
找到了一张很好的图,清晰地说明了langchain的六个核心模块分别是干啥的,以及相互怎么交互
相关的链接
Modules | 🦜️🔗 Langchain
下面我依据图来做一个langchain架构的解析
6 个核心模块组成:
- (Model I/O)
:以prompt来处理LLM的输入(模板template等)和输出(调整格式) - (Data connection)
:从网络or向量数据库中检索文本并分割成小块(LLM处理长度有限) - (Chains)
:Let LLM process step by step. 如此可以形成流水线,加快效率 - (Memory)
:主要用于维护LLM的短期记忆(其实就是上下文状态) - (Agents)
:最早应该是起源于论文ReAct,让LLM在文字推理中学会调用一下外部api (感兴趣的可以看之后的文章,toolformer和graph-toolformer等) - (Callbacks)
:跟踪大模型的状态等,例如其参数verbose就是对应一个回调函数