- 博客(9)
- 资源 (1)
- 收藏
- 关注
原创 AR、AE、Seq2Seq的区别与面试点
问题说明解决方案双向注意力问题模型能"看到"未来内容改为单向自注意力(添加因果掩码)预训练目标不匹配改为Next Token Prediction架构问题改为Decoder-only或添加Decoder一句话总结:BERT的双向注意力让它成为优秀的理解模型,但恰恰是这种双向性让它不适合生成任务。要让它做生成,必须将其改造为单向注意力的架构,就像GPT系列所做的那样。类型代表模型架构注意力方向训练目标适用任务AE双向语义理解ARGPT 系列单向(左到右)文本生成。
2025-11-28 19:31:35
375
原创 Day 6:文档加载
本文介绍了LangChain中的文档加载机制,重点解析了如何将不同格式文件转换为统一的Document对象。Document对象包含page_content(存储文本内容)和metadata(存储元数据)两个核心字段。文档加载是AI应用的关键第一步,LangChain提供多种加载器支持TXT、PDF、Markdown、HTML、Office文档等格式处理,并可通过DirectoryLoader批量加载目录文件。不同加载器支持多种处理模式(如单文档/结构化元素),为后续的文本处理、RAG和Agent应用奠定基
2025-11-25 20:26:21
403
原创 DeepAgents × LangGraph 深度解析:读懂下一代 Agent 框架的工作原理
本文介绍了基于LangGraph StateGraph的DeepAgents框架,该系统通过状态机方式构建智能代理。核心内容包括:1)框架采用任务规划与子代理委派双路径决策机制,前者处理本地任务,后者通过独立上下文实现模块化;2)内置完善的文件系统操作工具集;3)通过create_deep_agent编译为可执行代理,继承LangGraph的流式输出、检查点和人机交互等高级特性。文末提供了可运行的LangChain示例代码,展示了基础状态图和节点构建方法。该框架适合开发需要多步骤执行、状态回溯和子代理协作的
2025-11-25 19:23:37
815
原创 LangChain V1.0 30日学习计划 --- Day 5:工具体系
本文介绍了LangChain中的工具体系及其应用。工具被定义为Agent的超能力插槽,具有明确的输入输出格式和文档描述,可通过LCEL插入链路。文章从原理和工程需求两方面阐述了LLM需要工具的原因:解决幻觉、实时信息获取等问题,同时满足可控性、安全性等工业需求。工具构建方式包括@Tool装饰器、StructuredTool和Runnable,其中@Tool是最简单的实现形式,能自动生成输入schema和参数解析。文章详细说明了工具与模型绑定的完整生命周期,包括准备、思考、生成指令、执行和观察回填等步骤。通过
2025-11-23 18:36:03
1499
原创 FlyLoRA:果蝇神经机制启发的参数高效微调方法
摘要: FlyLoRA是清华大学团队提出的参数高效微调方法,受果蝇嗅觉神经回路启发,采用隐式混合专家架构实现任务解耦与参数高效。该方法通过冻结稀疏随机投影矩阵和top-k激活机制,降低80%训练成本,多任务合并性能下降仅1-2%,优于传统方法。适用于联邦学习、边缘计算等资源受限场景,实验显示在Llama-3.1-8B等模型上性能稳定。核心创新在于避免参数干扰,提升RL兼容性,为生物启发AI设计提供新路径。
2025-11-21 12:39:20
1210
原创 # LangChain V1.0 30日学习计划 --- Day 3:Prompt + Model + Message + OutputParser 工业写法
本文介绍了LangChain中PromptTemplate和Model模块的使用方法。在PromptTemplate部分,详细说明了模板字符串的编写规范,包括占位符、输入变量和常量变量的定义方式,并提供了工业级模板管理的实践方案,如模板注册表和工厂函数。针对对话场景,介绍了ChatPromptTemplate及其角色系统的应用。在Model部分,讲解了LangChain v1中将模型视为Runnable的设计理念,给出了ChatOpenAI的完整配置参数,包括温度值、最大令牌数等关键设置。最后提出了模型工厂
2025-11-20 13:33:28
1012
原创 LangChain V1.0 30日学习计划 --- Day 2:Runnable 彻底吃透
Runnable是LangChain Expression Language(LCEL)的核心构建块,用于创建可组合的AI工作流。主要包含四种核心类型:1) RunnableMap/RunnableParallel支持并行执行多个任务,以字典形式返回结果;2) RunnableSequence实现线性链式执行,前一步的输出作为下一步的输入;3) RunnableLambda将Python函数包装为可集成到工作流的Runnable对象;4) RunnableBranch根据条件选择不同执行路径,实现智能路由。
2025-11-20 00:10:37
624
原创 Day 1 环境 + 架构 + Demo 跑通
本文解析新版LangChain的四层架构设计: 架构层级: langchain_core:核心抽象层,提供Runnable、Prompt等基础组件 langchain_openai:模型连接层,集成OpenAI模型 langchain_community:第三方工具集成层 langchain:应用层,提供高级链和Agent功能 关键机制: Runnable接口标准化组件调用方式 LCEL编排语言使用管道符连接组件 支持任务拆分和分支处理 设计优势: 模块化架构提升灵活性,分离核心功能与扩展组件,降低系统复杂
2025-11-19 20:53:41
421
原创 LangChain V1.0 30日学习计划 --- Day 4 同步链与异步链
摘要: 本文介绍了LangChain中的同步链和异步链两种执行模式。同步链采用顺序执行方式,每个任务必须等待前一步完成,适合确定性流程(如问答、数据处理)。其核心组件包括PromptTemplate、LLM模型和输出解析器,使用invoke()方法执行。异步链通过ainvoke()实现并发处理,提升吞吐量,适用于批量任务。性能测试表明,异步模式在处理多个请求时显著优于同步模式。代码示例展示了两种链的构建与执行差异。
2025-11-19 20:03:12
1123
2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅