自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (1)
  • 收藏
  • 关注

原创 AR、AE、Seq2Seq的区别与面试点

问题说明解决方案双向注意力问题模型能"看到"未来内容改为单向自注意力(添加因果掩码)预训练目标不匹配改为Next Token Prediction架构问题改为Decoder-only或添加Decoder一句话总结:BERT的双向注意力让它成为优秀的理解模型,但恰恰是这种双向性让它不适合生成任务。要让它做生成,必须将其改造为单向注意力的架构,就像GPT系列所做的那样。类型代表模型架构注意力方向训练目标适用任务AE双向语义理解ARGPT 系列单向(左到右)文本生成。

2025-11-28 19:31:35 375

原创 Day 6:文档加载

本文介绍了LangChain中的文档加载机制,重点解析了如何将不同格式文件转换为统一的Document对象。Document对象包含page_content(存储文本内容)和metadata(存储元数据)两个核心字段。文档加载是AI应用的关键第一步,LangChain提供多种加载器支持TXT、PDF、Markdown、HTML、Office文档等格式处理,并可通过DirectoryLoader批量加载目录文件。不同加载器支持多种处理模式(如单文档/结构化元素),为后续的文本处理、RAG和Agent应用奠定基

2025-11-25 20:26:21 403

原创 DeepAgents × LangGraph 深度解析:读懂下一代 Agent 框架的工作原理

本文介绍了基于LangGraph StateGraph的DeepAgents框架,该系统通过状态机方式构建智能代理。核心内容包括:1)框架采用任务规划与子代理委派双路径决策机制,前者处理本地任务,后者通过独立上下文实现模块化;2)内置完善的文件系统操作工具集;3)通过create_deep_agent编译为可执行代理,继承LangGraph的流式输出、检查点和人机交互等高级特性。文末提供了可运行的LangChain示例代码,展示了基础状态图和节点构建方法。该框架适合开发需要多步骤执行、状态回溯和子代理协作的

2025-11-25 19:23:37 815

原创 LangChain V1.0 30日学习计划 --- Day 5:工具体系

本文介绍了LangChain中的工具体系及其应用。工具被定义为Agent的超能力插槽,具有明确的输入输出格式和文档描述,可通过LCEL插入链路。文章从原理和工程需求两方面阐述了LLM需要工具的原因:解决幻觉、实时信息获取等问题,同时满足可控性、安全性等工业需求。工具构建方式包括@Tool装饰器、StructuredTool和Runnable,其中@Tool是最简单的实现形式,能自动生成输入schema和参数解析。文章详细说明了工具与模型绑定的完整生命周期,包括准备、思考、生成指令、执行和观察回填等步骤。通过

2025-11-23 18:36:03 1499

原创 FlyLoRA:果蝇神经机制启发的参数高效微调方法

摘要: FlyLoRA是清华大学团队提出的参数高效微调方法,受果蝇嗅觉神经回路启发,采用隐式混合专家架构实现任务解耦与参数高效。该方法通过冻结稀疏随机投影矩阵和top-k激活机制,降低80%训练成本,多任务合并性能下降仅1-2%,优于传统方法。适用于联邦学习、边缘计算等资源受限场景,实验显示在Llama-3.1-8B等模型上性能稳定。核心创新在于避免参数干扰,提升RL兼容性,为生物启发AI设计提供新路径。

2025-11-21 12:39:20 1210

原创 # LangChain V1.0 30日学习计划 --- Day 3:Prompt + Model + Message + OutputParser 工业写法

本文介绍了LangChain中PromptTemplate和Model模块的使用方法。在PromptTemplate部分,详细说明了模板字符串的编写规范,包括占位符、输入变量和常量变量的定义方式,并提供了工业级模板管理的实践方案,如模板注册表和工厂函数。针对对话场景,介绍了ChatPromptTemplate及其角色系统的应用。在Model部分,讲解了LangChain v1中将模型视为Runnable的设计理念,给出了ChatOpenAI的完整配置参数,包括温度值、最大令牌数等关键设置。最后提出了模型工厂

2025-11-20 13:33:28 1012

原创 LangChain V1.0 30日学习计划 --- Day 2:Runnable 彻底吃透

Runnable是LangChain Expression Language(LCEL)的核心构建块,用于创建可组合的AI工作流。主要包含四种核心类型:1) RunnableMap/RunnableParallel支持并行执行多个任务,以字典形式返回结果;2) RunnableSequence实现线性链式执行,前一步的输出作为下一步的输入;3) RunnableLambda将Python函数包装为可集成到工作流的Runnable对象;4) RunnableBranch根据条件选择不同执行路径,实现智能路由。

2025-11-20 00:10:37 624

原创 Day 1 环境 + 架构 + Demo 跑通

本文解析新版LangChain的四层架构设计: 架构层级: langchain_core:核心抽象层,提供Runnable、Prompt等基础组件 langchain_openai:模型连接层,集成OpenAI模型 langchain_community:第三方工具集成层 langchain:应用层,提供高级链和Agent功能 关键机制: Runnable接口标准化组件调用方式 LCEL编排语言使用管道符连接组件 支持任务拆分和分支处理 设计优势: 模块化架构提升灵活性,分离核心功能与扩展组件,降低系统复杂

2025-11-19 20:53:41 421

原创 LangChain V1.0 30日学习计划 --- Day 4 同步链与异步链

摘要: 本文介绍了LangChain中的同步链和异步链两种执行模式。同步链采用顺序执行方式,每个任务必须等待前一步完成,适合确定性流程(如问答、数据处理)。其核心组件包括PromptTemplate、LLM模型和输出解析器,使用invoke()方法执行。异步链通过ainvoke()实现并发处理,提升吞吐量,适用于批量任务。性能测试表明,异步模式在处理多个请求时显著优于同步模式。代码示例展示了两种链的构建与执行差异。

2025-11-19 20:03:12 1123 2

离散数学 名词解释.txt

离散数学 名词解释.txt

2021-07-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除