如何创建自定义Retriever来增强LLM应用程序

最新推荐文章于 2025-04-03 19:30:00 发布

llzwxh888

最新推荐文章于 2025-04-03 19:30:00 发布

阅读量351

点赞数 3

文章标签：服务器运维 python

本文链接：https://blog.youkuaiyun.com/ppoojjj/article/details/144383231

版权

引言

在许多大语言模型（LLM）应用中，我们需要从外部数据源中检索信息，以便生成更准确和相关的响应。这些信息往往通过Retriever模块检索，然后用于生成提示，供LLM进行处理和响应。在这篇文章中，我们将深入探讨如何创建一个自定义Retriever，并提供代码示例来帮助你在自己的项目中实现这一功能。

主要内容

Retriever接口

要创建一个自定义Retriever，你需要扩展BaseRetriever类，并实现以下方法：

_get_relevant_documents：用于同步获取与查询相关的文档（必需）。
_aget_relevant_documents：提供异步支持（可选）。

通过继承BaseRetriever，你的Retriever不仅能自动成为一个LangChain的可运行对象，还能利用标准的Runnable功能。

实现细节

实现一个Retriever的核心在于_get_relevant_documents方法，它可以调用数据库或通过web请求获取数据。在某些情况下，由于某些地区的网络限制，开发者可能需要考虑使用API代理服务来提高访问的稳定性（例如使用{AI_URL}作为API端点）。

ToyRetriever示例

下面是一个简单的ToyRetriever的实现，它返回所有包含用户查询文本的文档。

from typing import List
from langchain_core.callbacks import CallbackManagerForRetrieverRun
from langchain_core.documents import Document
from langchain_core.retrievers import BaseRetr

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

llzwxh888

关注关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

（17-6-03）检索增强生成（RAG）：自定义信息检索器（Retriever）+集成检索器

码农三叔

04-29

1153

在LangChain中，自定义检索器（Custom Retriever）是一种强大的工具，它允许开发者创建专门针对特定数据源或需求的检索逻辑。检索器的主要作用是根据用户的查询从外部数据源检索相关的文档列表，这些检索到的文档通常会被格式化成提示（prompts），然后输入到大型语言模型（LLM）中，以便LLM可以使用这些信息来生成适当的响应（例如，基于知识库回答用户问题）。

MyScale Telemetry：开源版 LangSmith，增强 LLM 应用程序的可观测性

MyScale_VectorDB的博客

05-31

1509

MyScale Telemetry 是 LangSmith 的开源替代品，它提供与 LangSmith 类似的功能，包括跟踪和评估 LLM 应用程序。MyScale Telemetry 通过使用多功能强大的 MyScale SQL向量数据库和广泛使用的 Grafana 仪表板，减少了系统复杂性并提高了数据安全性。

参与评论您还未登录，请先登录后发表或查看评论

LangChain开发LLM应用【入门指南】

xiangyiran的博客

05-23

1398

通过将自然语言处理管道分解为单独的组件，开发人员可以轻松混合和匹配这些构建块，以创建满足其特定需求的自定义工作流程，从而使得 LangChain 成为一个高度适应性的框架，可用于为广泛的用例和行业构建对话式人工智能应用程序。简化LLM的集成：LangChain 支持广泛的 LLM（OpenAI 的 ChatGPT、Google 的 BERT等），并抽象了与特定模型或提供商交互的细节，使您可以轻松地在不同的LLM之间切换，而无需大量修改应用程序代码。根据用户的输入，代理可以决定是否调用这些工具中的任何一个。

使用 LiteLLM 构建适用于生产级规模的强大 LLM 应用程序。

php源码

07-29

1132

LiteLLM是一个 Python 库，旨在简化各种大型语言模型 (LLM) API 的集成。通过支持来自众多提供商的 100 多种 LLM 服务，它使用户能够使用标准化的 OpenAI API 格式与这些模型进行交互。提供商包括AzureAnthropicCohereOpenAIOllama和Sagemaker等知名公司。这种广泛的兼容性为用户提供了广泛的语言模型功能，简化了将高级语言模型合并到其应用程序中的过程。参考。

使用 LangChain 构建 LLM 应用详细教程（附python代码演练）

python123456_的博客

01-16

1016

欢迎来到语言处理的未来！在一个语言是连接人与技术的桥梁的世界中，自然语言处理（NLP）的进步为我们带来了令人难以置信的机会。其中一个重要的进步是革命性的语言模型，即大型语言模型（LLM），它彻底改变了我们与基于文本的数据进行交互的方式。我们将探索LLM的奇迹，并学习如何使用LangChain构建基于LLM的应用，LangChain是一个创新平台，充分发挥了LLM的潜力。语言模型在各种应用中具有重要意义，因为它们能够理解和生成类似人类的文本。

llm-universe | 四. 构建RAG应用

m0_37634594的博客

06-26

1012

Streamlit 是一种快速便捷的方法，可以直接在*Python 中通过友好的 Web 界面演示机器学习模型*。Streamlit 提供了一组简单而强大的基础模块，用于构建数据应用程序：st.write()：这是最基本的模块之一，用于在应用程序中呈现文本、图像、表格等内容。st.title()、st.header()、st.subheader()：这些模块用于添加标题、子标题和分组标题，以组织应用程序的布局。

通过Langchain创建你自己的Retriever（检索器）

weixin_48707135的博客

05-04

1499

构建Langchain中的自定义Retriever

一文解析如何基于 LangChain 构建 LLM 应用程序

Python栈

10-26

256

一文解析如何基于 LangChain 构建 LLM 应用程序

LLM应用开发第六课个人知识库

weixin_42291933的博客

06-30

1366

在对知识库文本进行分割和向量化后，就需要定义一个向量数据库用来存放文档片段和对应的向量表示了，在向量数据库中，数据被表示为向量形式，每个向量代表一个数据项。项目利用Langchain中的文本切割器完成知识库向量化操作前的文本分割，向量数据库使用高效的索引和查询算法来加速向量数据的存储和检索过程，快速的完成个人知识库数据建立与使用。：项目展示了 RAG 技术在解决 Langchain 幻觉问题方面的优势，通过结合检索和生成的方式，提高了信息的准确性和可靠性，为智能信息管理领域的技术创新提供了新的思路。

Haystack 的开源开发 LLM 应用设计框架

2301_79342058的博客

11-23

947

Haystack 是一款专为开发 LLM 应用设计的工具包，它特别适用于处理大量文本或文档的场景。Haystack 的特点是代码量少、易于上手，可以快速搭建生产级别的 LLM 应用。正如其名字暗示，Haystack 就像一组可以自由组合的积木，用于创建各种类型的 AI 系统。以下是一些 Haystack 可实现的功能：wp:list构建基于海量文档的问答型聊天机器人开发能够从多个文档中提取特定信息的系统创建可以理解并处理文本、图像等多种数据类型的应用程序/wp:list。

LANCHAIN：通过可组合性构建 LLM 应用程序 LANGCHAIN: BUILDING LLM APPLICATIONS THROUGH COMPOSABILITY

热门推荐

AI天才研究院

06-09

1万+

该报告描述了该模型的架构、预训练、微调、可扩展性和评估程序，以及与其部署相关的潜在安全挑战，例如偏见、虚假信息、过度依赖、隐私、网络安全、扩散和更多的。该报告还承认，在可靠性很重要的情况下应谨慎使用 GPT-4 的输出，并且该模型的功能和局限性会带来重大的安全挑战，需要进一步研究和干预。J.A.R.V.I.S-like AI 的概念曾经是漫威电影中遥不可及的梦想，现在正迅速成为可以想象的现实。该框架提供了快速管理、优化和序列化的功能，内存、代理和链实现的标准接口，并与端到端应用程序的其他工具集成。

基于 LangChain 构建 LLM 应用程序

wjianwei666的专栏

03-09

710

作为一款开源的 Python 框架，LangChain 旨在促进基于 LLM 的应用程序开发。基于所提供了一套工具、组件和接口等套件，LangChain 简化了以 LLM 为核心的应用程序的构建过程。通过 LangChain，开发人员能够轻松管理与语言模型的交互，无缝连接不同的组件，并集成 API 和数据库等资源。此外，借助 LangChain 技术，我们能够构建出一系列应用程序，这些应用程序能够生成创新性且与上下文相关的内容。

记一次排查与解决服务器线程/进程数超限的问题

进击的豌豆的博客

03-31

525

临时设置 kernel.pid_max，但重启后失效。使用 ps -L 查看具体进行的线程使用情况。永久设置 kernel.pid_max。查看当前线程数占用前5的进程信息。查看系统当前【线程/进程】总数。线程如何占用 PID 资源？

微端服务器

2503_90819036的博客

04-03

352

微端服务器是支撑微端（Micro Client）运行的核心基础设施，需兼顾**资源分发效率**、**低延迟访问**和**动态扩展能力**。| **存储类型** | **适用场景** | **示例服务** | **优势** || **场景** | **推荐配置** | **适用服务商** |

MCP服务器搜索引擎有哪些？MCP资源网站推荐

AIbase2024的博客

04-02

306

这里不仅提供了丰富的资源和强大的工具，还为开发者提供了全方位的支持和活跃的社区交流平台。AIbase的MCP资源网站提供了丰富的服务器资源，这些服务器能够暴露多种数据资源，涵盖文件、数据库记录、内存中的对象等。例如，通过配置文件系统MCP服务器，AI可以便捷地读取用户桌面的文件，为AI助手提供了广泛的数据支持。比如，查询数据库、执行文件写入操作等，为开发者提供了强大的工具支持，满足多样化的开发需求。这不仅优化了通信效率，还提高了系统的稳定性和可靠性，为AI与数据系统的高效连接提供了坚实保障。

服务器有2张显卡，在别的虚拟环境部署运行了Xinference，然后又建个虚拟环境再部署一个可以吗？