- 博客(965)
- 资源 (49)
- 收藏
- 关注
原创 RAG面试内容整理-10. 重排序器(reranker)模型与训练方法
重排序器(Reranker)是在检索阶段之后对初步候选结果进行精细排序的模型。典型的RAG流水线可能首先用高召回的检索器找出若干文档候选(例如Top 50)
2025-07-30 09:18:22
256
原创 RAG面试内容整理-9. 查询改写与增强(Query Rewriting, Query Expansion)
查询改写和查询增强是两种提升检索效果的技术,目标是在不改变用户意图的前提下,使检索器收到的查询更全面或明确,从而找到更多相关信息。
2025-07-30 09:16:35
155
原创 RAG面试内容整理-8. 文档分块策略(滑动窗口、语义切分)
RAG系统通常面对长文档或整篇知识库资料的检索需求,但大模型一次处理的文本长度有限,向量索引也需固定大小的文本片段。因此,将长文档拆分成合适片段是必不可少的步骤,被称为文档分块(chunking)策略。
2025-07-29 11:14:20
133
原创 RAG面试内容整理-7. 多轮问答与上下文拼接策略
在对话式的RAG应用中,多轮问答需要处理上下文相关性问题:用户的提问往往依赖于之前的对话内容。为正确理解用户每一轮的问题,系统需要保留和传递对话历史信息。
2025-07-29 10:54:06
20
原创 RAG面试内容整理-Prompt Engineering 在 RAG 中的作用
Prompt Engineering(提示工程)指为生成模型精心设计输入提示,以引导模型产生所需的输出。在RAG系统中,prompt设计对充分利用检索到的知识至关重要。
2025-07-28 10:31:27
177
原创 RAG面试内容整理-检索器与生成器的解耦架构
在RAG系统中,检索器(Retriever)与生成器(Generator)的解耦架构是实现灵活高效的关键设计。所谓解耦,即将检索相关文档和生成答案两个步骤分开,由不同的模块或模型负责。
2025-07-28 10:29:26
37
原创 RAG面试内容整理-4. 语义表示与向量化(BERT、DPR、ColBERT 等)
语义表示指将文本转换为能捕捉其语义信息的向量(嵌入)表示,以便进行相似度计算和检索。在RAG系统中,优秀的语义表示模型至关重要,因为检索器需要将查询和文档映射到同一向量空间中,使得相关的问答对距离更近。
2025-07-25 10:14:44
262
原创 RAG面试内容整理-3. 向量检索原理与常用库(ANN、FAISS、Milvus 等)
向量检索利用向量空间的相似度来查找相关内容,是近年来兴起的检索技术核心。其基础是在语义嵌入(embedding)模型的支持下,将文本、图像等数据表示为高维向量,以便通过向量相似度(如余弦相似度或欧氏距离)找到内容上的邻近项。
2025-07-25 10:12:36
135
原创 RAG面试内容整理-2. 稀疏检索基础(倒排索引、TF-IDF、BM25 等)
稀疏检索是信息检索的传统方法,利用词项匹配和统计权重来检索相关文档。典型的实现是倒排索引(Inverted Index):为每个词汇维护一个文档列表,从而能高效地根据查询词找到包含这些词的文档集合。
2025-07-24 11:48:02
132
原创 RAG面试内容整理-1. 检索增强生成(RAG)概述与意义
检索增强生成(Retrieval-Augmented Generation, RAG)是一种将大语言模型与外部知识库相结合的生成式AI架构。
2025-07-24 11:46:45
382
原创 LangChain面试内容整理-知识点29:LangChain与LlamaIndex等框架对比
LangChain和LlamaIndex(原GPT Index)都是流行的LLM应用开发框架,但侧重点有
2025-07-23 15:06:03
241
原创 LangChain面试内容整理-知识点28:LangChain部署实践
将LangChain应用从开发环境部署到生产环境,需要考虑封装服务接口、资源配置和监控维护等。LangChain提供了LangServe工具简化部署,也可自行集成到Web服务。
2025-07-23 15:02:48
147
原创 LangChain面试内容整理-知识点27:LangChain性能调优
LLM应用可能面临响应慢、成本高等性能问题。LangChain提供了一些优化方法和经验来提升性能和效率。
2025-07-22 10:17:54
162
原创 LangChain面试内容整理-知识点26:进阶 Agent:自主代理(Plan-and-Execute、BabyAGI、AutoGPT)
近期出现了一类“自治代理”(Autonomous Agent),如BabyAGI和AutoGPT,它们能在无需人类每步指令的情况下,自主规划并执行多步任务。LangChain也能实现类似概念的进阶Agent,主要通过Plan-and-Execute模式和长期记忆。
2025-07-22 10:16:45
101
原创 LangChain面试内容整理-知识点25:实战案例:对话聊天机器人设计
构建一个多轮对话的聊天机器人是LangChain的典型应用之一。关键点在于如何让机器人“记忆”上下文、保持一致的人格,并集成所需外部知识。
2025-07-21 10:28:59
153
原创 LangChain面试内容整理-知识点24:实战案例:智能助手 Agent 构建
本案例讲述如何用LangChain构建一个结合多个工具的智能助手 Agent。智能助手需要理解用户复杂请求,通过调用不同工具(如搜索、计算、查数据库等)执行多步推理,再给出答案。
2025-07-21 10:27:46
30
原创 LangChain面试内容整理-知识点24:实战案例:智能助手 Agent 构建
本案例讲述如何用LangChain构建一个结合多个工具的智能助手 Agent。智能助手需要理解用户复杂请求,通过调用不同工具(如搜索、计算、查数据库等)执行多步推理,再给出答案。
2025-07-18 10:12:50
164
原创 LangChain面试内容整理-知识点23:实战案例:检索增强生成(RAG)系统
检索增强生成(Retrieval-Augmented Generation, RAG)是一种将LLM与外部知识库结合的方法,通过实时检索相关信息来辅助生成答案。这极大缓解了LLM“封闭知识”过期或不足的问题。
2025-07-18 10:11:18
45
原创 LangChain面试内容整理-知识点23:实战案例:检索增强生成(RAG)系统
检索增强生成(Retrieval-Augmented Generation, RAG)是一种将LLM与外部知识库结合的方法,通过实时检索相关信息来辅助生成答案。这极大缓解了LLM“封闭知识”过期或不足的问题。
2025-07-17 11:03:45
330
原创 LangChain面试内容整理-知识点22:多模态与插件支持
LangChain不仅支持纯文本,还具备一定多模态处理能力,并能集成外部插件(如ChatGPT插件)的功能。这意味着LangChain应用可以涉及图像、音频等数据,以及使用OpenAI Plugins或自定义扩展,让LLM超出文本范畴完成任务。
2025-07-17 11:02:37
189
原创 LangChain面试内容整理-知识点21:LangSmith 调试与监控平台
LangSmith是LangChain官方推出的用于调试、测试和监控LLM应用的开发者平台和工具。它帮助开发者从原型阶段到生产部署,了解模型的行为表现、评估质量,并持续监控应用运行情况。
2025-07-16 18:05:27
254
原创 LangChain面试内容整理-知识点20:LangChain Expression Language (LCEL)
LangChain表达式语言(LCEL)是一种声明式语言,用于以配置/脚本的方式定义LangChain中的链条逻辑。
2025-07-16 18:04:11
152
原创 LangChain面试内容整理-知识点19:FAISS 向量数据库集成
FAISS是Facebook AI Research开发的开源库,用于高效相似度搜索和聚类。LangChain集成FAISS,使我们可以使用FAISS来存储和检索文本嵌入向量。
2025-07-15 10:43:27
185
原创 LangChain面试内容整理-知识点18:Chroma 向量数据库集成
Chroma是一个开源的嵌入向量数据库,专为LLM应用设计,存储和检索文本向量非常高效方。LangChain对Chroma提供了直接的集成接口,使开发者可以轻松地将文档嵌入存入Chroma并执行相似度检索。
2025-07-15 10:41:57
46
原创 LangChain面试内容整理-知识点17:HuggingFace模型集成使用
除了OpenAI云服务,LangChain也支持集成本地或 HuggingFace Hub 上的模型,包括文本生成模型和嵌入模型。通过HuggingFace的集成,我们可以在本地运行模型(充分利用自有GPU,保护隐私,降低成本)或调用 HuggingFace Hub 的推理API。
2025-07-14 10:42:12
144
原创 LangChain面试内容整理-知识点16:OpenAI API接口集成
LangChain对接OpenAI的API,使开发者能方便地使用OpenAI的各种模型(如GPT-3.5、GPT-4等)和功能(聊天、补全、嵌入等)。集成主要通过LangChain提供的OpenAI类封装来实现。
2025-07-14 10:40:36
47
原创 LangChain面试内容整理-知识点15:回调(Callbacks)与流式输出
摘要: LangChain的回调机制(Callback)通过钩子函数介入链或Agent的执行流程,支持日志记录、流式输出和监控等功能。核心是CallbackHandler接口,提供on_llm_new_token(流式输出)、on_tool_end(工具调用)等事件监听。应用场景包括:1) 实时输出:利用流式回调逐字返回LLM结果;2) 调试:通过内置StdOutCallbackHandler打印中间步骤;3) 监控:统计Token用量或记录LangSmith轨迹。使用时只需将回调实例传入callbacks
2025-06-15 09:46:52
174
原创 LangChain面试内容整理-知识点14:工具包(Toolkits)与用法
摘要: LangChain中的工具包(Toolkit)是将相关工具组合封装的功能插件,用于增强Agent在特定任务中的能力。内置工具包包括SQL数据库交互、向量检索、数学计算等功能模块,可通过load_tools函数便捷加载。开发者也可自定义工具包,只需将实现好的Tool对象组织成列表即可。工具包与单工具的核心区别在于:工具包提供成套解决方案,可能包含使用说明,使Agent能协调运用多个工具完成复杂任务。使用时通过initialize_agent将工具包赋予Agent即可扩展其能力范围。
2025-06-15 09:45:37
130
原创 LangChain面试内容整理-知识点13:输出解析(OutputParser)模块
LangChain的OutputParser模块解析 OutputParser是LangChain中处理LLM输出的关键组件,主要作用是将非结构化的文本输出转换为结构化数据。它通过以下机制实现高效解析: 格式控制 使用get_format_instructions()生成格式提示 将格式要求嵌入PromptTemplate 引导LLM按JSON等特定格式输出 核心功能 结构化解析:支持Pydantic模型转换 信息提取:正则匹配关键内容 错误处理:自动修正格式偏差 代理支持:解析动作指令 典型应用 将&qu
2025-06-14 09:51:30
219
原创 LangChain面试内容整理-知识点12:检索器(Retriever)接口与实现
LangChain中的Retriever是一个通用检索接口,负责根据自然语言查询从不同数据源获取相关文档。它比VectorStore更抽象,支持多种检索方式:向量相似度搜索、数据库查询、API调用等。关键点包括:1)Retriever统一了检索接口,只需实现get_relevant_documents方法;2)VectorStore可通过as_retriever()转换为Retriever;3)支持时间加权、上下文压缩等高级检索方式;4)可与Chain/Agent集成,实现知识增强的问答系统。Retriev
2025-06-14 09:38:01
172
原创 LangChain面试内容整理-知识点11:向量数据库(Vector Store)概念与应用
本文介绍了向量数据库在LangChain中的应用。向量数据库是存储高维向量并支持快速相似度搜索的专用数据库,核心用途包括:1)存储文档embedding向量;2)实现语义检索。LangChain通过VectorStore接口与主流向量数据库(如Chroma、FAISS、Pinecone)集成,提供文档入库、向量检索等统一操作。典型流程包括:用Embedding模型转换文本、构建向量索引、执行相似度搜索。这种机制是RAG(检索增强生成)的关键,使LLM能基于最新知识生成答案。文章还解答了相关面试问题,阐释了向
2025-06-13 10:18:35
172
原创 LangChain面试内容整理-知识点10:文本嵌入模型(Embeddings)使用
文本嵌入(Embeddings)是将文字转换为向量(高维数值向量)的过程和结果。在LangChain中,Embeddings模块负责调用各种嵌入模型,将文本转化为向量表示,以便后续在向量空间执行相似度搜索、聚类等操作。
2025-06-13 09:32:12
417
原创 LangChain面试内容整理-知识点8:内存(Memory)机制与类型
在对话式应用中,我们通常希望模型能“记住”之前的对话内容或中间结果。LangChain通过Memory(内存)模块来实现这一点。
2025-06-11 03:45:00
286
原创 LangChain面试内容整理-知识点9:文档加载器与文本分割
本文介绍了LangChain中构建知识库问答应用的关键预处理步骤——文档加载与文本分割。文档加载器(DocumentLoader)支持从PDF、HTML、数据库等100多种数据源读取内容并标准化为Document对象,内置解析器自动处理格式转换。文本分割器(TextSplitter)提供多种切分策略,推荐使用RecursiveCharacterTextSplitter保持语义完整,通过设置chunk_size和chunk_overlap参数控制段落长度和重叠区域。这两个模块协同工作,解决了LLM上下文限制和
2025-06-11 03:45:00
186
原创 LangChain面试内容整理-知识点6:PromptTemplate(提示模板)使用方法
PromptTemplate(提示模板)模块是LangChain中用于构建模型提示(prompt)的重要组件。它的作用是将用户输入和上下文参数格式化成最终发送给LLM的提示字符串或消息列表。
2025-06-10 03:30:00
149
原创 LangChain面试内容整理-知识点7:LLMChain 模块详解
LLMChain是LangChain中最基本也最常用的链(Chain)类型之一。它将一个提示模板(PromptTemplate)和一个LLM封装在一起,形成一个单轮交互的链条:输入 -> 格式化提示 -> LLM输出.cn。
2025-06-10 03:30:00
193
原创 LangChain面试内容整理-知识点5:LLM 接口与模型封装
LangChain通过统一接口封装不同语言模型,简化开发流程。核心功能包括:1)提供LLM、ChatModel和Embedding三类标准接口,屏蔽底层模型差异;2)支持OpenAI、HuggingFace等多种模型的无缝切换;3)自动处理API调用、参数配置和异常处理等细节。开发者只需关注业务逻辑,通过简单初始化即可调用不同模型,如OpenAI需设置API密钥,本地模型通过HuggingFacePipeline加载。这种设计实现了模型无关性,使应用能灵活切换不同厂商模型而无需重构代码,显著降低LLM集成门
2025-06-09 00:41:58
244
原创 LangChain面试内容整理-知识点4:工具(Tool)机制与实现
在LangChain中,工具(Tool)是智能体(Agent)、链(Chain)或LLM可以调用的外部函数接口。可以将Tool理解为LLM可以使用的能力或插件:通过调用工具,LLM能够获取额外的信息或执行特定的动作,比如查询数据库、搜索互联网、做数学计算等comet.compinecone.io。
2025-06-09 00:40:10
183
原创 LangChain面试内容整理-知识点2:链(Chain)模块与使用
链(Chain)是LangChain框架最基本的抽象之一,用于表示一系列连续的操作步骤。简单来说,Chain就是将多个组件调用按顺序链接起来:一个步骤的输出可作为下一个步骤的输入,形成一个管道medium.com。
2025-06-08 04:00:00
162
电流检测电路
2013-05-10
基于凌阳SPCE061A的简易语音计算器
2013-05-10
android C#开发
2013-05-10
opencv-intro
2013-05-10
xapp199 module testbench
2013-05-13
美的电磁炉标准通用板原理及故障维修
2013-05-10
OS_TASK.C(API)
2013-05-13
360SafeDemo
2013-05-13
PIC18F455-C-C++
2013-05-14
vbnet-10-8
2013-05-14
donuts-JavaScript
2013-05-14
mainlqrmatlab
2013-05-13
instantaneous-power
2013-05-24
JDBC-Excel-import-to-java
2013-05-13
androidwcf
2013-05-10
Setup-Android-SOP
2013-05-13
PHPjiemi-Compiler program
2013-05-14
data-用法(data-yongfa)
2025-04-21
微信小程序的全局变量(quanjubianliang)
2025-04-18
电源开关设计秘笈30例
2014-01-09
各种工业以太网技术的比较
2014-02-27
EtherCAT技术提高机械设备的竞争力_英文
2014-03-01
如何从现场总线升级到EtherCAT_英文
2014-03-01
德国倍福产品简介
2014-03-04
RDS资料
2014-07-23
未经修改的以太网协议不适用于工业自动化领域_中文
2014-02-27
未经修改的以太网协议不适用于工业自动化领域_英文
2014-02-27
如何从现场总线升级到EtherCAT_中文
2014-03-01
EtherCAT研发产品
2014-03-11
EtherCAT宣传册中文版
2014-03-04
Optical-simulation
2013-05-24
Java Develop shujuku
2013-05-24
STL-source-code-analysis
2013-05-24
RTC_stm32_usart_key
2013-05-24
基于ET1100的EtherCAT实时工业以太网从站设计
2014-01-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人