我真的是秦纪伟-优快云博客

原创 AR、AE、Seq2Seq的区别与面试点

问题说明解决方案双向注意力问题模型能"看到"未来内容改为单向自注意力（添加因果掩码）预训练目标不匹配改为Next Token Prediction架构问题改为Decoder-only或添加Decoder一句话总结：BERT的双向注意力让它成为优秀的理解模型，但恰恰是这种双向性让它不适合生成任务。要让它做生成，必须将其改造为单向注意力的架构，就像GPT系列所做的那样。类型代表模型架构注意力方向训练目标适用任务AE双向语义理解ARGPT 系列单向（左到右）文本生成。

2025-11-28 19:31:35 375

原创 Day 6：文档加载

本文介绍了LangChain中的文档加载机制，重点解析了如何将不同格式文件转换为统一的Document对象。Document对象包含page_content（存储文本内容）和metadata（存储元数据）两个核心字段。文档加载是AI应用的关键第一步，LangChain提供多种加载器支持TXT、PDF、Markdown、HTML、Office文档等格式处理，并可通过DirectoryLoader批量加载目录文件。不同加载器支持多种处理模式（如单文档/结构化元素），为后续的文本处理、RAG和Agent应用奠定基

2025-11-25 20:26:21 403

原创 DeepAgents × LangGraph 深度解析：读懂下一代 Agent 框架的工作原理

本文介绍了基于LangGraph StateGraph的DeepAgents框架，该系统通过状态机方式构建智能代理。核心内容包括：1）框架采用任务规划与子代理委派双路径决策机制，前者处理本地任务，后者通过独立上下文实现模块化；2）内置完善的文件系统操作工具集；3）通过create_deep_agent编译为可执行代理，继承LangGraph的流式输出、检查点和人机交互等高级特性。文末提供了可运行的LangChain示例代码，展示了基础状态图和节点构建方法。该框架适合开发需要多步骤执行、状态回溯和子代理协作的

2025-11-25 19:23:37 815

原创 LangChain V1.0 30日学习计划 --- Day 5：工具体系

本文介绍了LangChain中的工具体系及其应用。工具被定义为Agent的超能力插槽，具有明确的输入输出格式和文档描述，可通过LCEL插入链路。文章从原理和工程需求两方面阐述了LLM需要工具的原因：解决幻觉、实时信息获取等问题，同时满足可控性、安全性等工业需求。工具构建方式包括@Tool装饰器、StructuredTool和Runnable，其中@Tool是最简单的实现形式，能自动生成输入schema和参数解析。文章详细说明了工具与模型绑定的完整生命周期，包括准备、思考、生成指令、执行和观察回填等步骤。通过

2025-11-23 18:36:03 1499

原创 FlyLoRA：果蝇神经机制启发的参数高效微调方法

摘要： FlyLoRA是清华大学团队提出的参数高效微调方法，受果蝇嗅觉神经回路启发，采用隐式混合专家架构实现任务解耦与参数高效。该方法通过冻结稀疏随机投影矩阵和top-k激活机制，降低80%训练成本，多任务合并性能下降仅1-2%，优于传统方法。适用于联邦学习、边缘计算等资源受限场景，实验显示在Llama-3.1-8B等模型上性能稳定。核心创新在于避免参数干扰，提升RL兼容性，为生物启发AI设计提供新路径。

2025-11-21 12:39:20 1210

原创 # LangChain V1.0 30日学习计划 --- Day 3：Prompt + Model + Message + OutputParser 工业写法

本文介绍了LangChain中PromptTemplate和Model模块的使用方法。在PromptTemplate部分，详细说明了模板字符串的编写规范，包括占位符、输入变量和常量变量的定义方式，并提供了工业级模板管理的实践方案，如模板注册表和工厂函数。针对对话场景，介绍了ChatPromptTemplate及其角色系统的应用。在Model部分，讲解了LangChain v1中将模型视为Runnable的设计理念，给出了ChatOpenAI的完整配置参数，包括温度值、最大令牌数等关键设置。最后提出了模型工厂

2025-11-20 13:33:28 1012

原创 LangChain V1.0 30日学习计划 --- Day 2：Runnable 彻底吃透

Runnable是LangChain Expression Language(LCEL)的核心构建块，用于创建可组合的AI工作流。主要包含四种核心类型：1) RunnableMap/RunnableParallel支持并行执行多个任务，以字典形式返回结果；2) RunnableSequence实现线性链式执行，前一步的输出作为下一步的输入；3) RunnableLambda将Python函数包装为可集成到工作流的Runnable对象；4) RunnableBranch根据条件选择不同执行路径，实现智能路由。

2025-11-20 00:10:37 624

原创 Day 1 环境 + 架构 + Demo 跑通

本文解析新版LangChain的四层架构设计：架构层级： langchain_core：核心抽象层，提供Runnable、Prompt等基础组件 langchain_openai：模型连接层，集成OpenAI模型 langchain_community：第三方工具集成层 langchain：应用层，提供高级链和Agent功能关键机制： Runnable接口标准化组件调用方式 LCEL编排语言使用管道符连接组件支持任务拆分和分支处理设计优势：模块化架构提升灵活性，分离核心功能与扩展组件，降低系统复杂

2025-11-19 20:53:41 421

原创 LangChain V1.0 30日学习计划 --- Day 4 同步链与异步链

摘要：本文介绍了LangChain中的同步链和异步链两种执行模式。同步链采用顺序执行方式，每个任务必须等待前一步完成，适合确定性流程（如问答、数据处理）。其核心组件包括PromptTemplate、LLM模型和输出解析器，使用invoke()方法执行。异步链通过ainvoke()实现并发处理，提升吞吐量，适用于批量任务。性能测试表明，异步模式在处理多个请求时显著优于同步模式。代码示例展示了两种链的构建与执行差异。

2025-11-19 20:03:12 1123 2

Gof_man的博客